Il y a quelques mois j'avais mentionné dans un article le fait que les avancées dans le domaine de la biologie synthétique avaient permis la création de micro-organismes disposant d'un code génétique artificiel. D'abord obtenues en 2019, puis en 2025, ces nouvelles versions bricolées comprenaient respectivement trois et sept codons de moins que la version standard du code génétique. Pour rappel, un codon est un triplet de nucléotides, constituant soit l'ADN soit l'ARN, qui codent pour un acide aminé particulier. Les acides aminés étant les briques des protéines. En dépit des modifications apportées à l'ADN, ces micro-organismes ont conservé la capacité de se développer et de se reproduire. Dès lors, il est permis de s'interroger avec le plus grand sérieux sur la possibilité de l'existence passée de molécules d'ADN et d'ARN ayant fait usage de codes génétiques beaucoup plus simples et qui se seraient complexifiés par la suite.
Il s'avère que des équipes de recherche avaient déjà proposé, il y a quelques années, des versions de tels codes génétiques moins complexes. Leur comparaison peut nous conduire à envisager une hypothèse. Au moins trois versions plus simples ont déjà été présentées par deux équipes distinctes. Dans les trois cas, celles-ci comportent un nombre de codons distinct plus petit.
En 2002 une équipe japonaise a eu le mérite de proposer deux versions1 de complexité différente et dont l'une aurait pu évoluer à partir de l'autre pour aboutir ensuite au code génétique que nous connaissons.
Abonnez-vous à notre infolettre!
Pour ne rien rater de l'actualité scientifique et tout savoir sur nos efforts pour lutter contre les fausses nouvelles et la désinformation!
En premier lieu serait apparu le plus primitif des codes génétiques n'ayant nécessité que quatre codons (GGC, GCC, GAC et GUC), ayant codé quatre acides aminés, à savoir la glycine, l'alanine, l'acide aspartique et la valine. Celui-ci aurait évolué par la suite pour inclure 16 codons (GGC, GGG, GCC, GCG, GAC, GAG, GUC, GUG, CUC, GUG, CCC, CCG, CAC, CAG, CGC et CGG), qui auraient codé dix acides aminés (glycine, alanine, acide aspartique, valine, acide glutamique, leucine, proline, histidine, glutamine, arginine).
Il faut rappeler que les 64 codons du code génétique codent pour 20 acides aminés standards tous utilisés à la fabrication des protéines du vivant. L'équipe japonaise fait valoir de son côté que les quatre acides aminés issus de la traduction de leur code génétique primitif permettent la formation des quatre structures fondamentales présentes dans les protéines des organismes actuels, à savoir des structures hydrophobes et hydrophiles, des hélices α, des feuillets β et des coudes (ou spires).
Puis, en 2020, un chercheur a proposé qu'une version du code génétique à 27 codons ait pu précéder celle que nous connaissons2. La particularité de ce système tient au fait que seules trois des quatre bases habituelles auraient été présentes pour le codage des acides aminés. Des considérations énergétiques, entre autres, ont incité l'équipe à penser que, parmi les trois bases ou types de nucléotide retenus par l'évolution, une purine et deux pyrimidines (G avec C et U) en auraient été les constituants.
Un seul cheminement évolutif ?
À première vue on peut penser que les deux propositions se complètent. Un codage des acides aminés faisant intervenir l'ARN serait ainsi passé de 4 à 10, puis à 27 codons. Ce serait oublié un détail : alors que les deux versions les plus primitives disposent des quatre bases connues, la version soi-disant intermédiaire ne fait intervenir que trois d'entre elles, et ce, alors que la version actuelle en compte bien quatre. Il faudrait alors imaginer que les versions les plus primitives auraient évolué en perdant l'une des quatre bases pour éventuellement la retrouver dans la version la plus évoluée. Compte tenu de l'importance du codage des protéines pour l'existence de la vie, cela semble peu probable. Bien sûr on peut penser que ces constructions, qui restent théoriques, ne correspondent pas à la réalité. Une autre possibilité est toutefois envisageable. Tout comme pour l'évolution des espèces dans certains cas, il se pourrait ici que nous ayons affaire à un cas d'évolution moléculaire convergente. La convergence exprime l'idée d'aboutir à un résultat similaire par des chemins évolutifs distincts. Il se pourrait de la même façon que l'évolution moléculaire soit parvenue au même code génétique standard actuel par deux chemins évolutifs différents. On trouve ici une autre version précurseur du code génétique qui serait intermédiaire à celles proposées par l'équipe japonaise. Or, cette version pourrait difficilement constituer une version du code génétique qui aurait succédé à celles de l'équipe japonaise, car il faudrait pour cela que cette version intermédiaire ait perdu l'une des quatre bases, présente dans les versions antérieures proposées, avant de la retrouver plus tard dans le code génétique standard. D'où l'idée d'une évolution moléculaire convergente possible de ces versions vers celle que nous connaissons aujourd'hui.
À ce propos, s'il nous est permis d'imaginer que peuvent exister plusieurs cheminements qui seraient parvenus au code génétique standard, pourquoi ne pourrait-on pas en imaginer d'autres? Il est bon de faire remarquer ici que toutes les versions proposées font appel à des triplets pour la structure des codons : chacun d'eux, qui code pour un acide aminé, est composé de trois bases. De fait, parmi toutes les variations mineures pour le codage des acides aminés que l'on retrouve dans la nature jusqu'ici, cette règle des triplets est universelle, si bien qu'il semble naturel qu'elle ait été aussi adoptée dès les débuts. Et pourtant, si les versions primitives proposées ont disparu, alors on peut tout aussi bien imaginer que des versions primitives qui n'auraient pas respecté cette règle des triplets auraient aussi disparu. L'idée ici est d'imaginer, au départ, un système de codage faisant intervenir encore moins d'éléments, à savoir l'utilisation de seulement deux bases nucléotidiques au lieu de trois ou quatre. En triplet, deux bases distinctes peuvent offrir huit possibilités de codage avec la possibilité donc de coder huit acides aminés, dont les quatre essentiels selon l'équipe japonaise, mais, par la suite, on pourrait imaginer que ce code aurait évolué, non pas en ajoutant une autre base, mais plutôt de façon à ce que les triplets deviennent des quadruplets, c'est-à-dire que deux éléments distincts se retrouvent agencés en groupes de quatre. Cette extension aurait fait passer les possibilités de codage de 8 à 16 acides aminés. L'idée m'apparaît intéressante, car elle nous conduit à considérer que les ARN de transfert sont des molécules qui, elles aussi, ont pu subir une évolution pour se complexifier. Les ARN de transfert permettent d'établir un lien fixe entre un codon et un acide aminé particuliers.
Sauf qu'ici, cette évolution moléculaire ne nous conduit pas forcément à l'idée d'une convergence évolutive, mais plutôt à une évolution arborescente et, comme pour les espèces, la plupart des branches de cet arbre auraient conduit à des structures moléculaires qui seraient disparues aujourd'hui. Certes, il s'agit de spéculations. Malgré tout, il serait surprenant que l'évolution moléculaire, avec ses innombrables possibilités, n'ait pas abouti, à l'image de celle des espèces, à un arbre évolutif et c'est là l'un des mystères qu'il nous faudra tenter de résoudre.




