Emmanuelle Charpentier et Jennifer Doudna
𝐍𝐎𝐁𝐄𝐋 𝐃𝐄 𝐂𝐇𝐈𝐌𝐈𝐄 𝟐𝟎𝟐𝟎 :
𝐂𝐑𝐈𝐒𝐏𝐑-𝐂𝐀𝐒𝟗, 𝐂𝐈𝐒𝐄𝐀𝐔𝐗 𝐌𝐎𝐋𝐄́𝐂𝐔𝐋𝐀𝐈𝐑𝐄𝐒 𝐃𝐔 𝐆𝐄́𝐍𝐎𝐌𝐄.
L'attribution du Prix Nobel 2020 de Chimie est exceptionnelle, à plus d'un titre. D'abord, parce qu'il est attribué à deux femmes, et uniquement à elles, sans partage, pour des recherches effectuées en commun. Et que ce ne sont que les sixième et septième femmes à recevoir le Nobel de Chimie, sur 187 récipiendaires depuis que le prix à été institué en 1901. Marie Curie fut évidemment la première d'entre elles, en 1911, suivie de sa fille, Irène Joliot-Curie en 1935, de Dorothy Crowfoot Hodgkin en 1964, de Ada Yonath en 2009 et de Frances Arnold en 2018. Ensuite parce que le prix est attribué pour des travaux dont la première publication ne date que de 2012, donc très récemment, si on compare par exemple avec le dernier prix Nobel belge, François Englert, qui reçu le prix de Physique en 2013 pour des travaux publiés en 1964, ou encore Roger Penrose, qui a reçu ce mardi le prix de Physique également, pour des travaux datant des années '70. De plus, on évoquait déjà l'idée de leur attribuer le prix Nobel depuis 2015. Enfin parce qu'il s'agit d'une réelle révolution dans le domaine de la biologie moléculaire. La plus grande révolution depuis la découverte de la structure en double hélice de l'ADN par Jim Watson, Francis Crick et le cristallographie Maurice Wilkins en 1953, pour laquelle ils furent récompensés du Nobel de Médecine en 1962 (Il est important de rappeler que cette découverte n'aurait pas eu lieu sans les clichés de diffraction aux rayons X pris par Rosalind Franklin, et communiqués par Wilkins à Watson. Rosalind Franklin, aurait du, selon toute logique, être associée au Nobel, si elle n'était pas décédée en 1958).
Alors, de quoi s'agit-il ? Pour tenter d'expliquer les choses simplement, rappelons d'abord ce qu'est l'ADN, son rôle et les mécanismes utilisés par les cellules pour remplir ce rôle. L'ADN est une macromolécule qui contient toutes les informations génétiques, le génome, d'un organisme vivant. Cette information génétique est utilisée pour générer tous les mécanismes nécessaires à la vie et pour fabriquer tous les tissus. Le génome d'une espèce se distingue donc tout naturellement de celui d'une autre espèce. Mais même au sein d'une même espèce, le génome varie légèrement d'un individu à l'autre, ce qui fait que nous soyons tous différents. Chez les animaux et les plantes, l’ADN portant le génome est situé dans le noyau des cellules et est constitutif des chromosomes. Il est composé de deux longues chaînes prenant la forme de deux hélices entrelacées, l’une droite, l’autre gauche (tout comme des vis droites et des vis gauches) 🧬 . Ces chaînes sont formées de l’alternance d’un sucre, le désoxyribose, et d’un groupement phosphate, lequel est à nouveau attaché à un désoxyribose, et ainsi de suite. Chaque désoxyribose est également lié à un groupement moléculaire, appelé nucléotide. D’où le nom : acide désoxyribonucléique (ADN). Une chaîne d’ADN possède 4 types de nucleotides différents. Appelons-les A, G, C et T. Ces nucléotides ne s’enchaînent pas selon un ordre régulier mais selon une séquence très variable, par exemple ATAGGTACG... mais très précisément programmée. Les deux chaînes de la double hélice d’ADN sont différentes, mais pas de n’importe quelle manière. Pour pouvoir rester solidairement entrelacées, les deux chaînes créent des liens entre les nucléotides de l’une et de l’autre. A peut se lier à T et seulement à T. De même, G se lie à C et seulement à C. Si bien que sur chacune des chaînes, un A se trouve en face d’un T, et un G d’un C. Ces deux chaînes se correspondent donc, une séquence ATAGGCT sur l’une, correspondant à TATCCGA sur l’autre. Les deux chaînes de la double hélice sont ainsi appelées complémentaires l’une de l’autre. Une des implications les plus importantes de cette structure est la division cellulaire, d’une cellule mère en deux cellules filles. Lors de la division de la cellule, une nouvelle chaîne complémentaire à chacune des chaînes initiales vont être fabriquées, donnant naissance ainsi à deux nouvelles doubles hélices identiques, une pour chaque cellule. Cette division cellulaire a lieu par exemple lors de la croissance d’un embryon, ou lors de la réparation d’un tissu, suite notamment à une blessure.
Les gènes sont les entités du génome contenant chacun l’information nécessaire à la fabrication d’une protéine. Ces protéines jouent différents rôles clés dans l’organisme. Elles peuvent être des outils nécessaires pour qu’une réaction biochimique ait lieu. Ces proteines-là sont appelées enzymes. Elles peuvent être constitutives d’un tissu (parois cellulaires, muscles, parois des vaisseaux sanguins, par exemple), être des récepteurs pour certaines substances, sur les parois cellulaires, déclenchant un signal particulier dans la cellule ( les récepteurs à sérotonine ou à noradrenaline sur les neurones par exemple. Ou encore les récepteurs à insuline), ou elles peuvent former des canaux permettant l’échange de substances entre l’intérieur et l’extérieur d’une cellule ( les canaux de calcium du muscle cardiaque, par exemple). On voit donc toute l’importance de ces protéines, et donc de l’information nécessaire à leur fabrication contenue dans les gènes, information qui constitue donc un code, le fameux code génétique. Les protéines sont des enchaînements d’entités appelées acides aminés. Il en existe de 20 types différents. Chacun des 20 porte un nom comme glycine, glutamine, lysine ... Une protéine peut être constituée de plusieurs centaines d’acides aminés. Un gène de son côté est constitué d’une séquence pouvant comporter des milliers de nucléotides. Chacun des 20 types d’acides aminés d’une protéine correspond à un code formé de trois nucléotides successifs sur l’ADN. Pour reprendre les exemples d’acides aminés cités plus haut, le triplet CCG est un code correspondant à la glycine, GTG à la glutamine, ou TTC à la lysine, etc. Lorsqu’une protéine donnée vient à manquer, un signal est envoyé à l’ADN, et le gène correspondant est activé. Une molécule similaire à l’ADN, légèrement différente toutefois, et ne possédant pas la structure en double hélice, va être fabriquée le long d’un des deux brins du gène. Cette molécule est un acide ribonucléique ou ARN, constitué aussi de l’alternance d’un sucre, le ribose cette fois, et d’une entité phosphate. Les riboses sont également reliés à des nucléotides de 4 types. Trois sont les mêmes que ceux de l’ADN (A, G et C), tandis que T est remplacé par U de structure proche. L’ARN va se construire en transcrivant progressivement tout le code d’un gène par appariement de nucléotides complémentaires. A sera transcrit en U dans l’ARN, G en C, C en G, et T en A. Si bien que cet ARN aura la même longueur que le gène et emportera le code sous sa forme complémentaire. Il existe plusieurs types d’ARN, jouant des rôles différents. Celui-ci emporte le message génétique contenu dans un gène. On l’appelle ARN messager, ou mARN. Une fois construit, ce mARN va se détacher de l’ADN et va migrer vers des corps particuliers de la cellule, appelés ribosomes, qui vont, comme une tête d’enregistreur, lire le contenu de l’ARN messager, et pour chaque triplet de nucléotides, un acide aminé correspondant selon le code génétique, stocké dans la cellule, sera appelé. Au fur et à mesure que la lecture du mARN se poursuit, les acides aminés se lient les uns aux autres, et le message de l’ARN est traduit en une protéine. Protéine correspondant donc à l’information qui était contenue dans le gène.
À la fin des années 90, on a pu décoder tout le génome humain. C’est à dire qu’on connaît toute la séquence des nucléotides de l’ADN. De façon assez surprenante, les parties codantes, c’est à dire les parties formant les gènes ne constituent qu’une petite partie de la totalité de l’ADN. Le nombre de gènes humains est de l’ordre de 20000, mais ce n’est qu’une estimation actuelle. Le nombre précis n’est pas encore connu. Par contre on sait qu’une très grande partie de l’ADN n’est pas constituée de gènes. Toutefois, ces parties non codantes jouent elles-mêmes des rôles importants, d’autres types, qu’on ne discutera pas ici.
Venons en aux travaux de recherche qui ont valu à la Française Emmanuelle Charpentier et à l'Américaine Jennifer Doudna leur prix Nobel de Chime. Emmanuelle Charpentier est docteur en microbiologie, et a fait toute sa carrière de recherche en Autriche et en Allemagne. Elle est actuellement directrice au centre de recherche Max Planck pour la science des pathogènes. Jennifer Doudna est docteur en biochimie et professeure de biologie moléculaire à l'Université de Californie à Berkeley. Elles ont donc été récompensées pour leur remarquables travaux récents (puisqu'effectués au cours des 10 dernières années) sur l'immunité des bactéries contre les virus (particulièrement les bactériophages) grâce au système CRISPR-Cas9 présent dans l'ADN de bactéries et pour les techniques d'édition ( = de modification) du génome qu'elles ont mises au point à partir de ces recherches. Le système CRISPR-Cas9 est bien connu des microbiologistes depuis que l'ADN de bactéries a pu être séquencé dans les années 90, et de nombreux travaux ont été réalisés sur celui-ci au cours du XXIe siècle. CRISPR signifie "Clustered Regularly Interspaced Short Palindromic Repeats". En génomique, un palindrome n'a pas tout à fait la même signification que dans le langage courant. Il s'agit de courtes séquences de nucléotides pour lesquelles on retrouve plus loin dans la chaîne, une séquence de nucléotides qui leur sont complémentaires mais en ordre inverse. Par exemple, les séquences ATAGGACT et AGTCCTAT sont palindromiques. Il en résulte que dans l'ARN correspondant, ces séquences complémentaires peuvent se lier pour former une boucle en forme d'épingle à cheveux. Ces structures jouent des rôles particuliers dans les processus biomoléculaires, mais il n'est pas utile de les discuter d'avantage pour la compréhension générale du sujet. Cas9 quant à elle signifie "CRISPR-associated" protéine 9 (ou gène codant pour cette protéine). Les Cas sont des endonucléases, c'est à dire des enzymes capables de couper des acides nucléiques (ADN ou ARN) à un endroit situé au milieu de leur chaîne (des exonucléases coupent les extrémités). Les système CRISPR-Cas (il existe plusieurs types de Cas différents) ne se retrouvent que dans l'ADN des bactéries et des archées. On y retrouve des répétitions strictement identiques de séquences courtes (20 à 40 paires de nucléotides) de fragments d'ADN, se répétant ("direct repeats") en alternance avec des séquences variables, elles, appelées "spacers", de longueurs variant également entre 20 et 40 paires de nucléotides. Après ces alternances, il existe toujours des gènes (donc des parties codantes pour des protéines) de type "Cas" situé entre 300 et 500 nucléotides plus loin. L'endonucléase Cas9 est la seule à pouvoir couper un ADN non-autologue, c'est à dire provenant d'un organisme extérieur à la bactérie (un virus ou un plasmide). Elle coupe les deux chaînes de la double hélice d'ADN de cet agent qui les infecte, et le rend ainsi inactif et dans l'impossibilité de se reproduire. La protéine Cas9 est donc responsable de l'immunisation des bactéries contre les bactériophages et les plasmides.
Les travaux de Charpentier et Doudna ont ceci de remarquable, qu'elles ont pu élucider de façon très fine l'ensemble des mécanismes qui participent à cette immunité. Ces travaux de recherche ont été publiés dans Science, un des plus prestigieux journaux scientifiques, en 2012. On trouvera cet article ici : https://science.sciencemag.org/content/337/6096/816.full. Lorsqu'une bactérie est infectée par un virus ou un plasmide, une petite partie de l'ADN de celui-ci est copiée et insérée dans le système CRISPR de l'ADN de la bactérie, sous forme d'un nouveau "spacer", auquel s'ajoute également une nouvelle séquence "repeat". Tout le système CRISPR, constitué de l'ensemble de ses repeats et de ses spacers est ensuite transcrit en ARN. Cet ARN est appelé "ARN prémature du système CRISPR" ou sous forme plus simple pre-crARN. Les gènes Cas sont eux également transcrits en ARNs puis en leurs protéines correspondantes, dont l'endonucléase Cas9. Une Cas d'un autre type participe alors à la rupture du pre-crARN en toute une série d'ARNs plus courts, chacun d'entre eux correspondant à un ensemble repeat-spacer. Ces ARNs sont appelés ARNs matures du système CRISPR, notés simplement crARN. Tous les spacers étant différents, ces crARN sont donc tous différents, mais avec une partie commune provenant du repeat. L'un d'entre eux porte fatalement la séquence de nucléotides correspondant au morceau d'ADN copié de l'agent infectieux (virus ou plasmide) dans sa partie "spacer". Ou plutôt la séquence de nucléotides complémentaires, donc capable d'aller se lier à ce morceau d'ADN sur le virus ou le plasmide. C'est ce qui va se produire, et ceci va indiquer à la protéine Cas9 où elle doit venir se fixer à cet ADN étranger pour le détruire. Les deux chercheuses ont toutefois montré que pour être efficace et activer convenablement la fonction de coupure de la Cas9, un deuxième ARN était nécessaire. Celui-ci est plus long que le crARN et comporte une série de nucléotides complémentaires de la partie "repeat" du crARN, et donc capable de se lier à lui dans cette partie "repeat", tandis que la partie "spacer" du crARN se lie à l'ADN de l'agent étranger. Ce deuxième ARN est appelé "trans-acting small RNA" ou tracrARN. Il est généré par un gène situé au delà des gènes codant pour les protéines Cas. Ce complexe des deux ARN liés tracrARN:crARN et protéine Cas9 est requis pour une rupture efficace de l'ADN non-autologue ( = provenant du corps étranger, virus ou plasmide).
Leurs recherches sur ce processus d'immunisation des bactéries ne s'arrête pas là. Le tracrARN étant long (environ 90 nucléotides), elles ont étudié si l'ensemble de cette chaîne était nécessaire pour activer la coupure par la Cas9. Elles ont montré qu'une quarantaine de nucléotides suffisaient pour maintenir l'efficacité. Elles ont ensuite construit des ARNs artificiels (dits ARNs chimériques) de tailles variables, reprenant toujours la séquence "spacer" d'une vingtaine de nucléotides, se liant à l'ADN étranger, et en la prolongeant par des fibres d'ARN de longueurs variables, mais formant une boucle, en forme d'épingle à cheveux (reproduisant la partie liée du complexe tracrARN:crARN). Elles ont ainsi trouvé qu'une séquence en épingle à cheveux de 42 nucléotides (toujours les mêmes !) pouvait être attachée à la partie "spacer" complémentaire de l'ADN étranger, pour former un seul ARN chimérique efficace, au lieu d'un complexe de deux ARNs. Cet ARN chimérique porte le nom de ARN guide, ou gARN, puisqu'il guide la protéine Cas9 vers sa cible. Il faut encore ajouter que la rupture d'un ADN ne peut se faire à n'importe quel endroit, mais se fait uniquement juste après une courte séquence de nucléotides, séquence qu'on appelle PAM, pour "Protospacer Adjacent Motif". Il est donc facile d'identifier dans des gènes, à quels endroits pourront se faire des ruptures, et donc quelles sont les séquences d'une vingtaine de nucléotides qui sont adjacentes à ces PAM. Ces PAM sont présents dans tous les gènes de toutes les espèces. Et donc il est possible de construire des ARN guides pour n'importe quel gène de n'importe quelle espèce ! Charpentier et Doudna ont donc non seulement identifié dans ses détails le mécanisme immunitaire des bactéries, mais elles ont conçu des outils pour utiliser cette méthode pour couper des gènes de n'importe quelle espèce. Elles ont non seulement mis leurs découvertes au service de toute la communauté scientifique, mais ont aussi conçu des kits permettant de transfecter des cellules avec de l'ADN codant pour la protéine Cas9 et pour un ARN guide approprié pour la reconnaissance d'un locus particulier d'un gène cible.
A partir de ces travaux, de nombreux autres types de kits ont été développés, améliorant encore les performances de l'outil, et de très nombreuses solutions thérapeutiques émergent. En effet, si un gène quelconque peut être coupé, il peut aussi ensuite être désactivé, par reconnexion de parties non-homologues de l'ADN, rendant la protéine correspondante inactive. Il peut être réparé en corrigeant une mutation responsable d'une pathologie. On peut également insérer à l'endroit de la rupture une nouvelle séquence de nucléotides, voire un gène additionnel entier. Parmi des approches déjà étudiées, il y a évidemment la possibilité d'inactiver l'ADN d'agents pathogènes, comme des bactéries précisément, alors que celles-ci deviennent de plus en plus résistantes aux antibiotiques. La lutte contre les virus est bien sûr également envisagée en grande priorité. Mais de très nombreuses équipes de par le monde ont déjà entrepris des recherches en thérapie génique utilisant cette approche pour laquelle Emmanuelle Charpentier et Jennifer Doudna ont été les pionnières. Une approche est déjà au point pour soigner l'anémie falciforme, cette maladie grave dans laquelle les globules rouges prennent la forme de petites faucilles, et sont incapables de transporter l'oxygène dans les cellules. Des solutions thérapeutiques sont déjà entrevues pour des maladies telles que la mucoviscidose, la dystrophie musculaire de Duchenne, le glaucome, pour n'en citer que quelques unes. Mais déjà aussi, des modifications géniques ont été introduites chez des moustiques des genres Aedes et Anopheles pour qu'ils ne puissent plus être vecteurs de la malaria, en espérant qu'un jour ceux-ci puissent devenir dominants dans les zones où la maladie décime les populations. Une des causes de la propagation des cellules cancéreuses est le fait que les lymphocytes T de notre système immunitaire ne peuvent faire la différence entre cellules saines et cancéreuses, et donc ne luttent pas efficacement contre ces dernières. Des pistes sont étudiées pour éteindre certains gènes ou au contraire en activer d'autres de ces lymphocytes T pour augmenter leur activité anti-tumorale. Voici quelques exemples du large horizon thérapeutique que cette révolution génétique a ouvert.
Il faudra toutefois rester prudent, car comme pour toute grande découverte, il y a un revers à la médaille. Les progrès gigantesques que cette approche apporte en manipulation génique, ouvre également de nombreuses nouvelles voies aux organismes génétiquement modifiés (OGM). A titre personnel, toutefois, je m'empresse de dire que tout n'est pas négatif en matière d'OGMs, contrairement à ce qu'on crie parfois trop facilement, en comprenant peu ce que cela signifie. Créer des plantes génétiquement modifiées pour permettre de les rendre résistantes au glyphosate n'est certes pas une bonne chose. En rendre certaines résistantes au mildiou par exemple me parait être une très bonne chose, surtout dans des régions où il faut nourrir une population de plus en plus nombreuse. Rendre une espèce végétale résistante à une maladie n'est guère différente que développer une thérapie génique contre la mucoviscidose ou le cancer. De telles thérapies ne conduisent d'ailleurs à rien d'autre qu'à des humains OGM. Donc, gardons notre raison.
Là où c'est encore beaucoup plus insidieux, et où les règles de bioéthiques devront sans doute être renforcées, c'est que l'approche permet en principe (à terme en tous cas) de choisir certains caractères de son enfant : couleur des yeux, taille, capacités physiques ou intellectuelles. Et ça surtout, ce n'est pas souhaitable du tout. Les recherches sur les embryons sont déjà bien encadrées par des règles internationales de bioéthique. Il n'empêche que l'an dernier, en mars 2019, le journal Nature, un autre des journaux scientifiques les plus prestigieux, a publié un article sur le scandale d'un biophysicien chinois, He Jiankui, qui a annoncé la naissance de deux filles dont il a modifié préalablement certains gènes par la méthode CRISPR-Cas9 (https://www.nature.com/articles/d41586-019-00673-1)
Pour en savoir plus sur le sujet : https://www.medecinesciences.org/en/articles/medsci/full_html/2015/12/medsci20153111p1014/medsci20153111p1014.html