La croissance de la « bouillie » —ou, en anglais, slop— ce contenu de mauvaise qualité généré par l’intelligence artificielle, atteint la production scientifique. Dans certaines disciplines, des groupes tirent la sonnette d’alarme sur le fait qu’ils reçoivent de plus en plus de propositions de textes qui ont été apparemment générés par des applications.
À lire également
Ce n’est pas une surprise : dans l’écosystème de la recherche universitaire, le « publier ou périr » est depuis des décennies désigné comme un problème: ça peut inciter des chercheurs peu scrupuleux à publier souvent, au détriment de la qualité. Au cours des deux dernières décennies, on a également vu apparaître le phénomène dit des « revues prédatrices », qui publient n’importe quoi pourvu qu’on les paie, un phénomène qui n’aurait pas pu devenir lucratif s’il n’existait pas cette pression énorme à publier.
Mais l’arrivée de l’IA fait craindre que certains secteurs puissent être carrément submergés par ces contenus sans intérêt et sans originalité. Déjà en novembre, la plateforme de prépublication ArXiv avait pris la décision inédite de désormais refuser les revues d’articles ou les prises de position provenant des sciences informatiques, ayant constaté une hausse aussi soudaine qu’anormale des textes refusés par les modérateurs.
Abonnez-vous à notre infolettre!
Pour ne rien rater de l'actualité scientifique et tout savoir sur nos efforts pour lutter contre les fausses nouvelles et la désinformation!
Un reportage récent du magazine The Atlantic donne la parole à la directrice de l’intégrité en recherche et de l’éthique des publications aux Presses de l’Université Cambridge, Jennifer Wright, qui note que certains des domaines où des signaux d’alarme commencent à se faire entendre, sont d’une importance plus vitale —la recherche sur le cancer, par exemple. « Quelqu’un peut proclamer avoir testé les interactions entre une tumeur cancéreuse et une seule protéine, parmi les milliers qui existent, et en autant qu’on n’y rapporte pas de découvertes dramatiques », peu de chercheurs du domaine sentiront un besoin urgent de tenter de répliquer les résultats.
Le volume est, ici, l’enjeu. Et ce n’est pas un enjeu nouveau. Au 19e siècle, on trouvait des éditeurs de revues scientifiques qui se plaignaient que le volume de textes reçus devenait impossible à gérer. L’anecdote provient de l’historien des sciences Alex Csiszar, de l’Université Harvard: c’est ce « surplus » qui a conduit à l’émergence du concept de « révision par les pairs » (peer review), c’est-à-dire ce système, aujourd’hui central à la publication scientifique, qui consiste à faire relire un manuscrit par des experts du même domaine, avant de décider s’il doit être publié. Les éditeurs ont ainsi allégé leur charge de travail, en plus de déléguer une responsabilité à des scientifiques plus capables qu'eux d’évaluer la valeur d’une recherche.
Mais avec l’arrivée de l’IA, les éditeurs et leurs réviseurs bénévoles « sont à nouveau assiégés ».
Ironiquement, parmi les disciplines universitaires qui commencent à être touchées, il y a… la recherche sur l’IA. Et ça ne devrait pas être une surprise non plus, explique The Atlantic: la concurrence entre des jeunes chercheurs est énorme, et la tentation doit être grande pour eux de publier le plus vite possible quoi que ce soit sur les larges modèles de langage, les vedettes de l'heure. Aussi longtemps que subsistera cette énorme pression à publier que subissent les chercheurs de toutes les disciplines, la tentation d’envoyer un texte qui a pu être produit en quelques secondes, sera là chez les moins scrupuleux d'entre eux.
Jusqu’où cela pourrait-il conduire? Il existe ironiquement une théorie du complot à ce sujet : la « théorie de l’Internet mort ». Celle-ci stipule que pratiquement plus aucun humain n’écrit sur Internet : le réseau aurait été complètement pris en charge par des bots qui se répondraient mutuellement depuis 2016.
La théorie avait plutôt à l’origine une valeur satirique. Mais dans le monde de la recherche, l’accélération de l’IA fait peur: combien de temps avant que la littérature scientifique ne soit écrite par des IA… et révisée par d’autres IA?





