publication-doigt.jpg

Pour contrer la poussée de croissance des articles scientifiques créés avec l’aide de l’IA, la plateforme ArXiv a choisi une voie détournée: elle n’acceptera plus les revues d’articles ou les prises de position provenant des sciences informatiques.

Ça pourrait être la première mesure prise pour officiellement contrer ce phénomène qui commence à inquiéter l’écosystème de l’édition scientifique. Si une publication dotée d’un comité de révision par les pairs effectue un tamisage des propositions d’articles qu’elle reçoit, en revanche, une plateforme comme ArXiv est là pour publier un maximum de choses. On l’appelle « plateforme de prépublication » parce que sa mission est précisément de mettre en ligne des études qui n’ont pas encore été révisées par d’autres scientifiques. 

Née en 1991, ArXiv est de loin la plus ancienne et la plus populaire de ces plateformes : elle a donné à des chercheurs l’opportunité de publier des études préliminaires en urgence —par exemple, pour assurer une forme de propriété intellectuelle sur une découverte.

Abonnez-vous à notre infolettre!

Pour ne rien rater de l'actualité scientifique et tout savoir sur nos efforts pour lutter contre les fausses nouvelles et la désinformation!

Or, avec l’IA, le risque de voir une explosion de textes de faible qualité, générés par des chercheurs peu scrupuleux, est beaucoup plus élevé: des alertes en ce sens ont été lancées à quelques reprises depuis 2024. Et bien qu’on ne puisse pas prouver la part de l’IA, le directeur scientifique d’ArXiv, Steinn Sigurðsson, note que le nombre de textes rejetés par les modérateurs est passé dans la dernière année à 10%, alors qu’il n’était que de 2 à 3% auparavant. 

En annonçant sur son blogue, le 31 octobre, la décision de désormais refuser les revues d’articles et les prises de position en sciences informatiques, ArXiv note que ce n’est pas, « techniquement », une nouvelle décision: les politiques de la plateforme considéraient déjà que pour ces deux types de textes, l’autorisation de publier était laissée à la discrétion des modérateurs. Ils sont à présent complètement bannis. 

Pourquoi eux? Parce que ces textes émanant des sciences informatiques étaient particulièrement longs à réviser pour les modérateurs, explique dans la revue Nature le directeur de la section sciences informatiques chez ArXiv, qui est aussi chercheur à l’Université d’État de l’Oregon. « Ce que nous voyons, ce sont beaucoup [de textes] qui sont juste des bibliographies annotées sans analyse, synthèse ou plan de travail… Nous soupçonnons qu’il existe des marchés où de telles citations peuvent être achetées. »

Je donne