Les statistiques s'invitent en biologie
(Agence Science-Presse) " Vous me proposez une solution compliquée à un problème que je nai pas. " Cette réaction dun chercheur illustrait bien le scepticisme auquel se heurtait Robert Nadon lorsquil travaillait à améliorer statistiquement les études sur lexpression des gènes. " Quelques mois plus tard, il ma rappelé pour me dire quil avait rencontré un certain nombre de difficultés et quil voudrait finalement en savoir plus sur lutilisation des statistiques ! "
Aujourdhui, les méthodes statistiques sont régulièrement utilisées et Robert Nadon sest attaqué à un nouveau champ : la recherche pharmacologique.
Le chercheur se définit comme un méthodologiste, cest-à-dire quelquun qui questionne les méthodes utilisées pour la recherche et cherche à les améliorer. " Jai toujours voulu savoir comment nous savons ce que nous savons " raconte-t-il. Cest ce qui la amené aux statistiques : comme lexplique son collègue James Hanley, les chercheurs ont une grande confiance dans les chiffres, " ils traitent les nombres comme sils étaient absolus ". Mais pour cette équipe de lUniversité McGill, les chiffres peuvent être biaisés pour de multiples raisons. Heureusement, les statistiques sont un outil efficace pour mieux les utiliser !
Cest dans lune des premières étapes de la recherche de médicaments que
les deux compères sont allés fourrer leur
nez de statisticiens. Le " criblage à
haut débit " vise à trouver des
molécules prometteuses pour de nouveaux médicaments.
Le principe est simple : on veut trouver un composé
qui ait une réaction donnée, on teste 100
000 composés (rien que ça !), répartis
en très petits échantillons sur des plaques
de 100. Ensuite, on mesure à quel point chacun
réagit et on garde les meilleurs pour les étudier plus en profondeur.
Dédoublement
Le problème, cest que, contrairement
à ce que les chercheurs veulent bien croire,
les résultats du test ne reflètent
pas toujours le pouvoir intrinsèque des différents
produits. " Cest un peu comme pour
un examen, selon les sujets ou la forme des candidats,
ils vont avoir des résultats qui ne correspondent
pas forcément à leur valeur réelle. "
Des composés peu efficaces ont pu, par hasard,
obtenir de très bons résultats, alors quinversement,
certains, très efficaces, auront eu de mauvais
résultats et seront abandonnés. C'est ce
qu'on appelle des faux positifs et des faux négatifs.
Première solution : " on étudie lensemble des données et on
repère les variations régulières
qui sont dues à des erreurs systématiques
(par exemple, une pipette bouchée). Ensuite,
il suffit de modifier les résultats pour compenser
la variation " explique Nathalie Malo, étudiante
au doctorat.
Pour les erreurs qui relèvent du pur hasard, léquipe a aussi une solution
en apparence anodine : tester les composés
plusieurs fois. Tout simplement parce quune moyenne
de plusieurs résultats donnera toujours une meilleure
idée du potentiel dun produit quun
résultat unique. Cela relève du bon sens?
Pas dans le criblage à haut débit. Les biologistes
qui testent si un médicament augmente le risque
de crise cardiaque ont toujours fait des expériences
multiples, mais " dans le criblage à haut
débit, cest comme si on faisait lexpérience
sur un seul patient, tout en faisant 100 000 expériences à la fois ! " samuse Robert Nadon.
Les biologistes rétorqueront peut-être qu'un humain et une molécule, ce n'est pas pareil:
ignorer un effet secondaire et perdre l'ébauche
d'un médicament, ce n'est pas comparable. Par ailleurs,
qui dit dédoublement, dit coûts accrus. Ceci
dit, le problème des coûts joue dans les
deux sens: un bon composé que l'on a ignoré
parce qu'on n'a pas répété l'expérience
aurait pu être le médicament idéal
et rapporter gros; et un mauvais composé inutilement
pris en compte va faire lobjet de tests supplémentaires
qui ne rapporteront rien. Bref, ce quon perd à
faire des doubles, on pourrait bien l'économiser ailleurs
Le seuil idéal
Reste à choisir la limite à partir de laquelle on juge les composés dignes
de passer à létape supérieure.
Si on choisit un seuil bas, on aura plus de faux positifs
et inversement. Et ce que montrent les chercheurs, cest
quen combinant lusage de doubles avec un seuil
plus bas, on peut arriver à l'équilibre
idéal: moins de bons composés qui passent inaperçus, sans augmenter le nombre de "mauvais".
Alors, quand verra-t-on ces conseils appliqués ? Pour Robert Nadon, les statistiques devraient être intégrées progressivement à la formation des biologistes. En attendant, des logiciels pourraient permettre aux biologistes actuels de mettre en uvre ces conseils. " Je prêche un peu pour ma paroisse, mais je crois quil vaut mieux plutôt engager un statisticien, car les logiciels sont trop vite dépassés " objecte Nathalie Malo. Mais Robert Nadon insiste : " les scientifiques ne devraient pas se décharger sur une personne tierce. Cela fait partie de la responsabilité des chercheurs que de sassurer de la solidité de leurs données. "

