Ceux qui se souviennent du logiciel capable de générer tout seul de faux résumés de recherches, se réjouiront que ce canular ait apparemment servi à dénoncer une arnaque: les congrès bidon pour lesquels des scientifiques sont invités à soumettre des recherches, à un prix défiant toute concurrence.

Mais cette fois, l’arnaque a un effet collatéral : elle atteint aussi des éditeurs sérieux. C’est ainsi que lundi, 24 février, les éditeurs Springer (Allemagne) et IEEE (Institute of Electrical and Electronic Engineers, États-Unis) ont annoncé qu’ils retiraient de leurs archives plus de 120 articles, après qu’un chercheur français eut révélé qu’il s’agissait d’articles générés par ordinateur.

La facilité même avec laquelle cette «découverte» a été faite révèle l’ampleur du problème: Cyril Labbé, de l’Université Joseph-Fourier de Grenoble, a conçu depuis deux ans un système permettant de détecter les textes produits par SciGen, le logiciel-générateur de textes. SciGen a été créé en 2005 par un trio de l'Institut de technologie du Massachusetts (MIT), précisément pour prouver que des congrès aux origines douteuses pouvaient accepter des articles sans vérifier: SciGen se contente de mélanger au hasard des mots-clefs et des segments de phrases, et y ajoute même des graphiques, donnant à l’oeil non exercé l’apparence d’un article rempli de jargon scientifique.

SciGen est aussi un logiciel libre, de sorte qu’au fil des années, plusieurs personnes l’ont effectivement utilisé pour «tester» —et avec succès— la rigueur plus que douteuse de certains congrès.

Les 120 articles dont il est question ici proviennent des Actes de 30 congrès, publiés entre 2008 et 2013. Toutes ces publications ne sont offertes que sur abonnement —rien à voir avec un scandale similaire, l’an dernier, qui semblait cibler les revues en accès libre.

De plus, sans que Cyril Labbé ne se risque à expliquer pourquoi, la majorité de ces 30 congrès ont eu lieu en Chine.

Plusieurs des signataires des «articles» sont de véritables personnes dans de véritables institutions: sans que quiconque ne puisse porter d’accusation, il semble que certains chercheurs peu scrupuleux peuvent profiter de faux organisateurs de congrès pour augmenter leur «facteur d’impact». Selon Nature, Labbé aurait tenté de rejoindre certains des auteurs, mais n’aurait reçu que de rares réponses. Le journaliste de Nature a essayé aussi, et n’a reçu aucune réponse.

«Les articles étaient très faciles à trouver», explique Labbé, qui a créé un site pour qui voudrait vérifier si un article suspect a été «rédigé» par SciGen. Il avait décrit sa technique en 2013 dans la revue Scientometrics —et avait à l’occasion pu informer IEEE de l’existence de 85 faux articles. Ceux-ci avaient été immédiatement retirés. Mais le problème demeure entier, à en juger par les 120 nouveaux.