Une compagnie virtuellement inconnue du milieu scientifique aurait-elle pu créer à elle seule une immense base de données des dossiers de plus d’un millier d’hôpitaux sur tous les continents? Dans cette histoire qui restera dans les mémoires sous le nom de Lancetgate, ce qui étonne n’est pas tant qu’un entrepreneur manifestement très ambitieux soit allé aussi loin, mais que personne chez The Lancet n’ait flairé le piège.

Derrière cette « étude » parue le 22 mai dans cette revue médicale britannique et prétendant comparer les effets de l’hydroxychloroquine sur des dizaines de milliers de patients hospitalisés pour cause de coronavirus, il y avait une compagnie américaine appelée Surgisphere. Une petite compagnie qui, révélait une enquête du Guardian le 3 juin, ne comptait que six employés, dont « un auteur de science-fiction » et un « mannequin de contenu pour adultes ». Une compagnie qui prétendait gérer l’une des plus grosses bases de données d’hôpitaux au monde, mais qui était singulièrement difficile à rejoindre par son site web. Une compagnie dont le fondateur et directeur, Sapan Desai —et un des quatre signataires de l’étude— avait été nommé dans trois poursuites pour mauvaise pratique de la médecine —des allégations qu’il a qualifiées la semaine dernière de « sans fondements ». Et enfin et surtout, une compagnie dont la base de données au centre de toute cette affaire n’existait apparemment pas il y a un an. Dans les mots d’un de ceux qui suivent à la trace depuis cet hiver les résultats des études sur l’hydroxychloroquine, cité par The Guardian: « Surgisphere est sortie de nulle part pour réaliser peut-être l’étude globalement la plus influente en seulement quelques semaines ».

Ça n’a pas de sens. Il faudrait beaucoup plus de chercheurs que ce qu’ils proclament pour qu’une étude multinationale de cette taille soit possible à cette vitesse.

La base de données est censée avoir servi à un autre article, portant lui aussi sur la Covid-19 mais pas sur l’hydroxychloroquine, et qui est paru le 1er mai dans le New England Journal of Medicine (NEJM).

Dès la parution de l’article dans The Lancet, ce qui dérangeait était toutefois ailleurs : le manque de transparence des auteurs de l’étude quant à l’ensemble de leurs données. Il n’est pas inhabituel pour un chercheur de ne pas tout rendre public, pour des raisons de confidentialité ou de propriété intellectuelle, mais le climat d’urgence entourant la Covid-19 en a poussé un grand nombre ces derniers mois à ouvrir les vannes. Dans ce cas-ci, il a d’abord fallu que, le 28 mai, des journalistes de l’édition australienne du quotidien The Guardian signalent des erreurs dans les données relatives à leur pays —un nombre de décès supérieur à la réalité— pour que Sapan Desai admette une erreur « mineure ». Et puis, la réalité l’a rattrapé. Le 2 juin, The Lancet publiait une mise en garde (expression of concern) signifiant qu’une enquête interne était en cours. Dès le 4 juin, le couperet tombait: les trois autres signataires —qui ne sont pas des employés de Surgisphere— demandaient que leur étude soit retirée et le Lancet publiait un avis de rétractation. Le NEJM suivait une heure plus tard.

Sapan Desai a certes déclaré ces derniers jours que la base de données s’était constituée progressivement, au fil des années (la compagnie existe depuis 2008 mais elle a été fondée comme entreprise productrice de contenus pédagogiques en médecine). Mais autant le site de Surgisphere que les paragraphes consacrés à la méthodologie dans les deux études, sont avares de détails sur cette base de données. Ce qui ne serait pas non plus inhabituel en temps normal, une compagnie pouvant souhaiter ne pas se faire damer le pion par un concurrent. Mais vu l’ampleur de l’étude sur l’hydroxychloroquine, cela soulève des questions pratiques sur les ententes intervenues hôpital par hôpital: qui ramasse les données et les envoie? Qui se charge d’anonymiser les dossiers des patients? Quelle technologie emploie-t-on? Et qui se charge d’harmoniser des données qui, puisqu’elles proviennent des quatre coins du monde, sont inévitablement encodées dans plus d’un système informatique. Le rôle joué par sa « plateforme d’analyse des données en santé », QuartzClinical, n’est pas non plus devenu plus clair. Et le site QuartzClinical est indisponible depuis quelques jours.

S’il s’avère qu’il s’agit d’une arnaque, ce ne sera pas la première personne issue du milieu scientifique à s’être fait prendre la main dans le sac. Mais c’est le rôle de The Lancet qui se retrouve sur la sellette. Dans la course à la publication qui marque la crise sanitaire depuis janvier, d’aucuns ont critiqué la surabondance d’études « pré-publiées », c’est-à-dire déposées en ligne dans la précipitation, sans avoir été révisées par les pairs. Bien qu'il soit normal qu’il y ait précipitation en temps de pandémie et bien qu'il soit normal que des études incomplètes ou même erronées soient pré-publiées, The Lancet n'est pas un serveur de pré-publication. Il est censé y avoir un comité de réviseurs qui est censé avoir lu et analysé cette étude avant d’autoriser sa publication. Même si ces réviseurs devaient alléguer dans les prochains jours ne pas avoir eu accès, eux non plus, aux données complètes, les scientifiques et les journalistes qui sont intervenus depuis le 22 mai ont démontré qu’il était malgré cela possible de détecter des anomalies.