L'ancêtre de la souche Wuhan de SARS-CoV-2 circulait fin octobre 2019

Le coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) a été signalé pour la première fois dans un cas de Wuhan, en Chine, en décembre 2021, puis est devenu la cause de la pandémie de coronavirus 2019 (COVID-19) qui ravage le monde aujourd’hui. Une nouvelle étude dans la revue Biologie moléculaire et évolution suit ses variantes partout dans le monde depuis le début de la pandémie.

Le séquençage génomique a eu lieu en utilisant des centaines de milliers d’échantillons génomiques viraux. Les chercheurs ont utilisé le meilleur de ces séquences pour révéler comment le virus a muté et changé à différentes périodes et régions de la pandémie.

Étude: Un portrait évolutif du progéniteur SRAS-CoV-2 et de ses ramifications dominantes dans la pandémie de COVID-19. Crédit d'image: vchal / Shutterstock

Sommaire

Utiliser une nouvelle approche

Les méthodes conventionnelles n’ont pas produit d’historique fiable de l’émergence de ce virus pour plusieurs raisons. Celles-ci incluent les nombreuses erreurs de séquençage répandues dans les séquences disponibles, le faible degré de divergence des séquences et le fait qu’il y a peu de sites qui aident à comprendre la descente du virus.

Le fait que tous les génomes précoces du SRAS-CoV-2 d’origine humaine (jusqu’en janvier 2020) varient de moins de 30 bases est particulièrement remarquable. À l’inverse, les coronavirus non humains les plus étroitement apparentés diffèrent de plus de mille bases.

L’importance de ceci est que « Sans une racine fiable du SRAS–CoV–2 phylogénie, la séquence ancestrale la plus récente ne peut pas être reconstruite avec précision et il n’est pas possible d’évaluer la diversité génétique du SRAS–CoV–2 qui existait au moment de sa première flambée. »

De plus, la distance entre les échantillons de Wuhan et le progéniteur restera inconnue, tout comme la direction et l’ordre des premières mutations qui ont donné naissance aux différentes souches et lignées de SARS-CoV-2.

Ils ont utilisé des méthodes informatiques conçues à l’origine pour découvrir comment des mutations se produisaient dans les cellules tumorales chez un seul patient. L’approche utilisée est appelée approche par ordre de mutation (MOA) et peut fournir une image directe des variantes et mutations ancestrales par ordre de temps.

Quels ont été les résultats?

Le MOA a été utilisé sur deux ensembles de génomes du SRAS-CoV-2, comprenant respectivement près de 30000 et 68000 génomes, à deux jours d’intervalle de trois mois. En traçant la piste de mutation, déduite du deuxième ensemble de génomes, ils ont pu comprendre comment le virus subit des changements dans différentes régions et à différents moments. Ils ont pu retrouver l’ancêtre commun le plus récent (MRCA) du SRAS-CoV-2.

Ancêtre commun

Ce génome viral progéniteur a trois bases qui diffèrent des souches de Wuhan. Les chercheurs pensent que le Wuhan et les autres génomes les plus anciens à échantillonner étaient en fait des variantes du coronavirus progéniteur (CoV), qui ont divergé en lignées ν et α.

La diversité préexistait au cas le plus ancien

La souche de Wuhan a subi trois mutations consécutives, α1, α2 et α3, mais celles-ci ne se trouvent pas dans les CoV étroitement apparentés, qui ont tous la même base à ces trois positions. Les variantes ν du progéniteur CoV ne montrent pas les 47 autres variantes à ces positions, ce qui les rend peu susceptibles d’être la lignée ancestrale du virus Wuhan-1 ou d’autres échantillons précoces. Le premier mutant ν a été ramassé près de deux mois après la souche Wuhan-1.

Il y a eu plusieurs occurrences du géniteur CoV, à la fois en Chine et aux États-Unis, à partir de janvier 2020. Des échantillons de coV ancêtres synonymes ont été trouvés dans de nombreux autres échantillons prélevés dans les deux semaines suivant la souche Wuhan-1.

Alors que ceux-ci étaient principalement chinois et asiatiques (presque 90/130), ils ont été trouvés dans tous les continents échantillonnés et ont persisté jusqu’en avril 2020 en Europe.

Ces résultats suggèrent que le progéniteur CoV se propageait déjà largement avant et après les premiers rapports officiels sur l’émergence d’un nouveau coronavirus en Chine. En d’autres termes, il est peu probable que la souche Wuhan-1 soit l’ancêtre original du SRAS-CoV-2 dont toutes les souches actuellement en circulation sont dérivées.

Ceci est en contraste avec les études précédentes, probablement parce que cette analyse utilise plus d’échantillons d’une base de données globale, et identifie ainsi la lignée ν très précoce, qui n’est pourtant pas la MRCA. On pense que ce dernier a précédé la variante de Wuhan de 6-8 semaines, soit fin octobre 2019.

En fait, des scientifiques italiens ont trouvé un fragment de protéine de pointe du SRAS-CoV-2 en Italie début décembre, qui ressemblait exactement au génome de Wuhan-1.

L’analyse du deuxième ensemble de génomes a montré le même schéma conduisant aux mêmes conclusions. Deux nouvelles mutations ont été identifiées appartenant aux groupes ζ et η à partir de mi-mars 2020.

Les empreintes génomiques virales permettent un suivi dans le temps et la région

L’histoire des mutations a conduit à une collection d’empreintes génétiques allant du progéniteur CoV à la souche actuelle. Chacun est nommé pour les principales variantes incluses.

Ce génome progéniteur et ses branches ont depuis conduit à un ensemble de lignées ou de souches, dont certaines (par exemple, D614G) ont rapidement atteint une domination mondiale ou régionale en très peu de temps.

Les souches nord-américaines ont toutes appartenu aux mêmes lignées pendant la majeure partie de la période pandémique. Il s’agissait principalement de αβ avec son mutant (αβγδ), qui est resté dominant depuis avril 2020.

Graphique de l’historique des mutations du SARS-CoV-2 à partir de l’ensemble de données 29KG. Des flèches épaisses marquent le chemin des variantes répandues (fréquence, vf = 3%) et des flèches minces montrent des chemins menant à d’autres mutations courantes (3%> vf> 1%). Les tailles des camemberts sont proportionnelles aux fréquences des variantes dans l’ensemble de données 29KG, avec des camemberts affichés pour les variantes avec vf> 3% et la couleur du camembert en fonction de la région du monde où cette mutation a été observée pour la première fois. Un cercle est utilisé pour toutes les autres variantes, la couleur remplie correspondant à la première région d’échantillonnage. L’indice de cooccurrence (COI, police noire) et le niveau de confiance bootstrap (BCL, police bleue) de chaque mutation et de sa mutation prédécesseur sont indiqués à côté de la flèche les reliant. Les valeurs BCL soulignées marquent les paires de variantes pour lesquelles les BCL ont été estimées pour des groupes de variantes (voir Matériels et méthodes) en raison de la nature épisodique de l’accumulation de variantes au sein des groupes entraînant des BCL plus faibles (<80%; flèches en pointillés). Les changements de base (n.) Sont indiqués pour les mutations synonymes, et les changements d'acides aminés (p.) Sont indiqués pour les mutations non synonymes avec les noms de gène / protéine.

En Asie et en Europe, le taux de changement des souches dominantes est élevé, convergeant vers αβε de juillet à août 2020, puis αβεη. Ceux-ci sont ensuite passés à αβζ, en commençant à trois semaines des premiers échantillons de variantes ε. De nombreuses souches continuent de circuler à des fréquences élevées en Asie et en Amérique du Nord.

La variante sud-africaine a l’empreinte génétique αβγδ et la variante britannique αβε l’empreinte génétique. Les deux ont la mutation de pointe N501Y, et les deux présentent des propriétés identiques de plus grande infectiosité. Au moment de l’étude, l’empreinte digitale αβζ était dominante, alors qu’aujourd’hui, probablement la variante britannique a pris le dessus.

Quelles sont les conclusions?

Les chercheurs ont identifié le MRCA pour les variants du SRAS-CoV-2 en circulation aujourd’hui, qui n’est probablement pas le virus Wuhan-1 mais son ancêtre. Cela implique « qu’aucun des premiers patients ne représente le cas index ou n’a donné lieu à toutes les infections humaines. »

L’approche MOA utilisée ici a donné le génome progéniteur CoV, qui donne un arbre phylogénétique mieux enraciné, un ordre de mutation et des mutations divergentes dans les séquences génomiques. L’approche sera pertinente pour de telles flambées pathogènes, même avec des échantillons plus grands qui peuvent, en fait, donner des résultats plus précis.

Son application continue au SRAS–CoV–2 génomes et autres épidémies de pathogènes produiront leurs génomes ancestraux et leur dynamique spatio-temporelle, améliorant notre compréhension de l’évolution passée, actuelle et future des pathogènes et des maladies associées. »

Les chercheurs ont mis en place un tableau de bord qui sera constamment mis à jour avec les mutations émergentes et reflétera les tendances de propagation virale dans le temps et par région. De plus, un outil simple est fourni pour classer un génome donné par mutations clés (http://sars2evo.datamonkey.org/).