Les soumissions d’examens générées par l’IA échappent à la détection dans une université britannique


Notes médianes obtenues par les soumissions réelles (orange) et IA (bleu) dans chaque module individuel et toutes combinées. Les limites des classes 2 : 2, 2 : 1 et 1ère classification sont représentées par des lignes pointillées. Crédit : Scarfe et al., 2024, PLOS ONE, CC-BY 4.0 (creativecommons.org/licenses/by/4.0/)

Lors d’un test du système d’examens de l’Université de Reading au Royaume-Uni, les soumissions générées par l’intelligence artificielle (IA) sont restées presque entièrement indétectées, et ces fausses réponses avaient tendance à recevoir des notes plus élevées que celles obtenues par les vrais étudiants. Peter Scarfe de l’Université de Reading et ses collègues présentent ces résultats dans la revue en libre accès PLOS ONE le 26 juin.

Ces dernières années, les outils d’IA tels que ChatGPT sont devenus plus avancés et plus répandus, ce qui suscite des inquiétudes quant au fait que les étudiants les utilisent pour tricher en soumettant des travaux générés par l’IA comme étant les leurs. Ces inquiétudes sont renforcées par le fait que de nombreuses universités et écoles sont passées d’examens en personne supervisés à des examens à domicile non supervisés pendant la pandémie de COVID-19, et nombre d’entre elles poursuivent désormais ce modèle. Les outils de détection de textes écrits générés par l’IA ne se sont jusqu’à présent pas révélés très efficaces.

Pour mieux comprendre ces problèmes, Scarfe et ses collègues ont généré des réponses rédigées à 100 % par le chatbot IA GPT-4 et soumises au nom de 33 faux étudiants au système d’examens de l’École de psychologie et des sciences du langage clinique de l’Université de Reading. Les évaluateurs des examens n’étaient pas au courant de l’étude.

Les chercheurs ont découvert que 94 % de leurs soumissions d’IA n’étaient pas détectées. En moyenne, les fausses réponses ont obtenu des notes plus élevées que les réponses des vrais étudiants. Dans 83,4 % des cas, les soumissions d’IA ont reçu des notes plus élevées qu’un groupe sélectionné au hasard du même nombre de soumissions d’étudiants réels.

Ces résultats suggèrent la possibilité que les étudiants puissent non seulement utiliser l’IA pour tricher, mais qu’ils puissent également obtenir de meilleures notes que celles obtenues par leurs pairs qui ne trichent pas. Les chercheurs envisagent également la possibilité qu’un certain nombre d’étudiants réels aient pu s’en tirer avec des soumissions générées par l’IA au cours de cette étude.

Du point de vue de l’intégrité académique, remarquent les chercheurs, ces résultats sont extrêmement préoccupants. Ils notent qu’un retour aux examens supervisés en personne pourrait aider à résoudre ce problème, mais à mesure que les outils d’IA continuent de progresser et d’infiltrer les lieux de travail professionnels, les universités pourraient se concentrer sur la manière d’adopter la « nouvelle normalité » de l’IA afin d’améliorer éducation.

Les auteurs ajoutent : « Un test aveugle rigoureux d’un système d’examens universitaires réel montre que les soumissions d’examens générées par l’intelligence artificielle étaient pratiquement indétectables et obtenaient des notes nettement supérieures à celles des vrais étudiants.

Les résultats des « Examens Turing Test » invitent le secteur de l’éducation mondiale à accepter une nouvelle normalité et c’est exactement ce que nous faisons à l’Université de Reading. Les nouvelles politiques et les conseils à notre personnel et à nos étudiants reconnaissent à la fois les risques et les opportunités offertes. par des outils qui utilisent l’intelligence artificielle.

Plus d’information:
Un test réel d’infiltration par l’intelligence artificielle d’un système d’examens universitaires : une étude de cas “Test de Turing”, PLoS UN (2024). DOI : 10.1371/journal.pone.0305354

Fourni par la Bibliothèque publique des sciences

Citation: Les soumissions d’examens générées par l’IA échappent à la détection dans une université britannique (26 juin 2024) récupéré le 26 juin 2024 sur

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.



Related posts

Une étude révèle que les fumeurs sont en moyenne plus extravertis, mais moins consciencieux et agréables

Une étude révèle que le cerveau stocke les souvenirs moteurs différemment en fonction de l’incertitude de la décision

Comment 36 000 sachets de thé enterrés contribuent à expliquer la décomposition globale