Génomique utilisée pour retracer l'origine du SRAS-CoV-2 au Canada

Une nouvelle étude publiée en juin 2020 sur le serveur de préimpression bioRxiv * discute de l'utilisation de l'analyse phylogénétique pour retracer l'origine du coronavirus du syndrome respiratoire aigu sévère 2 (SRAS-CoV-2), et sa propagation au Canada, puis au Canada. Les résultats de l'étude peuvent aider à optimiser les politiques de santé publique en cas de futures flambées.

Les coronavirus

Au cours des deux dernières décennies, il y a eu trois nouveaux coronavirus qui ont provoqué des épidémies humaines – le syndrome respiratoire aigu sévère Coronavirus (SRAS-CoV) en 2002, le syndrome respiratoire du Moyen-Orient (MERS-CoV) en 2012 et le SRAS-CoV-2 en 2019. Il s'agit d'infections zoonotiques, provenant probablement de chauves-souris et se propageant à l'homme, peut-être après avoir traversé un autre hôte vertébré.

Le SRAS-CoV-2 est une particule sphérique avec un génome à ARN simple brin, qui a plusieurs régions – les gènes codant pour la réplicase ORF1ab, la pointe (S), l'enveloppe (E), la membrane (M) et la protéine nucléocapside (N), respectivement, à partir de l'extrémité 5 '. La protéine S facilite l'entrée virale en se liant au récepteur de l'hôte, l'enzyme de liaison à l'angiotensine 2 (ACE2), et présente la plus grande variabilité parmi la séquence génétique, et est commune au SARS-CoV-2 et au SARS-CoV. Pourtant, le premier a une affinité beaucoup plus élevée pour la liaison au récepteur, environ 10 à 20 fois supérieure.

Virus SARS-CoV-2 se liant aux récepteurs ACE-2 sur une cellule humaine, stade initial de l'infection COVID-19, illustration 3D conceptuelle K par Kateryna Kon

Virus SARS-CoV-2 se liant aux récepteurs ACE-2 sur une cellule humaine, le stade initial de l'infection par COVID-19. Crédit d'image: Kateryna Kon / Shutterstock

Abondance des données génomiques sur le SRAS-CoV-2

Actuellement, il existe de nombreuses séquences de génomes publiées dans diverses bases de données publiées – près de 54 000 dans GISAID, environ 24 000 dans NCBI et près de 8 000 dans ViPR. On observe trois clades viraux majeurs qui montrent une distribution non uniforme sur différentes régions géographiques, probablement à cause des mutations fondatrices. La plupart des isolats asiatiques proviennent de la superclade I, tandis que les isolats américains se trouvent principalement dans la superclade II. La plupart des isolats de la côte est européenne et américaine se trouvent dans la superclade III.

Parmi les isolats de superclade III, nombreux sont ceux qui présentent une mutation A23403G caractéristique, qui est considérée comme conférant une meilleure aptitude virale, peut-être car elle devient rapidement prédominante par rapport à d'autres souches dans le monde entier. Il fait également partie d'un épitope antigénique qui a induit la production d'anticorps au virus SARS-CoV antérieur. Cela peut provoquer une fuite d'anticorps et ainsi permettre une réinfection chez ceux qui ont récupéré de COVID-19.

L'étude: analyse phylogénétique du virus dans l'est de l'Ontario

L'étude actuelle a utilisé 25 génomes viraux séquencés issus des premiers cas en Ontario, au Canada, pour recréer la descendance phylogénétique du SRAS-CoV-2. Tous les échantillons provenaient des premiers cas dans cette région, et par conséquent, la source de l'infection proviendrait, directement ou indirectement, de contacts liés aux voyages.

Les génomes provenaient tous de virus isolés de prélèvements nasopharyngés, et l'analyse du génome a été réalisée sur la base de deux hypothèses principales. Premièrement, ils ont supposé que des séquences identiques provenaient de la même souche ancestrale, plutôt que d'évoluer indépendamment. Deuxièmement, de nouvelles mutations ont été supposées se produire à un taux d’environ 1 paire de bases tous les 7 à 21 jours, comme cela a été observé avec un taux moyen d’environ 24 pb de substitutions par an dans l’analyse Nexstrain du GISAID.

Les génomes individuels ont été interrogés par rapport à un ensemble de référence local d'environ 25 000 génomes extraits de la base de données GISAID. Ils ont conservé ces génomes, qui étaient remarquablement similaires, avec deux ou moins asymétries, réduisant ainsi le nombre à environ 1200. Lorsque des génomes identiques de sujets différents ont été appariés, le nombre final est descendu à 72 séquences uniques.

La séquence racine a été ajoutée en utilisant une séquence de Wuhan. L'analyse a montré que 59/72 séquences avaient la même ascendance commune, avec pas plus de quelques acides aminés substitués ou autres résidus. La suppression de ces différents groupes a permis aux chercheurs de ne voir que les génomes des patients et les précieuses séquences ancestrales.

Trois grands clades, des origines différentes

L'étude a montré que 25/45 variantes trouvées dans tous les génomes étaient sous la forme de substitutions de cystéine en thymine, puis de guanine en thymine en 7 variantes. Toutes les variantes partagées étaient présentes sur les deux allèles. Les chercheurs ont découvert qu'il y avait deux grands clades, deux avec quatre mutations dans le clade S (C8782T et T28144C) et 23 (C241T, C3037T, C14408T et A23403G) avec quatre mutations dans le clade G. Ce dernier a des grappes plus petites.

Une analyse phylogénétique des génomes locaux a ensuite été appariée avec les séquences de référence, qui ont montré les 13 génomes ancestraux qui sous-tendent les origines et la propagation de ces génomes canadiens. Cela comprend le génome ancestral vu avec la référence 1, et maintenant vu presque uniquement en Amérique du Nord, principalement aux États-Unis.

Un autre ensemble d'échantillons appartient au cluster 1 du clade G, principalement en Europe, et en particulier au Royaume-Uni et en Espagne. Les patients atteints de ces souches ont des antécédents de voyages européens, ce qui confirme cette piste.

Plusieurs autres échantillons du groupe G-clade 2 proviennent de quelques séquences ancestrales trouvées principalement en Amérique du Nord, et ici aussi, l'histoire des voyages confirme l'origine américaine de l'infection dans ces cas. Il y avait quatre grappes d'échantillons, dans la grappe 2 du clade G, qui ont le même génome et étaient probablement infectées à partir de la même source.

Arbre phylogénétique Nextstrain des cas locaux de SARS-CoV-2 et des séquences ancestrales les plus similaires dans la base de données GISAID. L'échantillon 23 dans le clade S semble dérivé de séquences ancestrales 1 qui comprend principalement des séquences d'Amérique du Nord (USA). Les échantillons 1,10 et 12 du G-clade 1 sont dérivés de la séquence ancestrale 68 et d'autres qui semblent principalement d'origine européenne (Royaume-Uni, Espagne, Portugal). Les 19 autres échantillons du G-clade 2 sont dérivés de la séquence ancestrale 72 et d'autres qui semblent être principalement d'origine nord-américaine (USA).

Arbre phylogénétique Nextstrain des cas locaux de SARS-CoV-2 et des séquences ancestrales les plus similaires dans la base de données GISAID. L'échantillon 23 dans le clade S semble dérivé de séquences ancestrales 1 qui comprend principalement des séquences d'Amérique du Nord (USA). Les échantillons 1,10 et 12 du G-clade 1 sont dérivés de la séquence ancestrale 68 et d'autres qui semblent principalement d'origine européenne (Royaume-Uni, Espagne, Portugal). Les 19 autres échantillons du G-clade 2 sont dérivés de la séquence ancestrale 72 et d'autres qui semblent être principalement d'origine nord-américaine (USA).

La protéine S du SRAS-CoV-2 est considérée comme limitant la gamme d'hôtes et est également l'antigène immunodominant. L'analyse actuelle a réussi à trouver trois mutations uniques et nouvelles dans la région S, qui sont toutes synonymes et conserveront donc à la fois la virulence et les épitopes. Ils ont également trouvé un autre site avec une variante faux-sens, C25217T, avec une substitution glycine-cystéine, mais son effet reste à comprendre.

Il y avait cinq variantes hétérozygotes, quatre trouvées seulement dans un échantillon et une partagée entre deux échantillons.

Dans l'ensemble, les chercheurs ont noté: «Ces corrélations entre l'origine phylogénétique et les antécédents de voyage signalés indiquent comment le séquençage du génome viral peut retracer avec succès l'origine des infections par le SRAS-CoV-2 au Canada.» Les échantillons qui montraient des séquences identiques pourraient provenir soit d'une source commune d'infection, soit du fait d'un transfert communautaire. Ce dernier est probablement attribuable au fait que ces patients n'ont aucun antécédent de voyage à l'extérieur du Canada, mais ont eu des contacts les uns avec les autres.

Faits déroutants de l'analyse phylogénétique

Il existe d'autres échantillons avec la même séquence mais où il n'y a aucun lien connu entre les individus. Il est important de retrouver la trace parmi tous ces patients afin d'identifier les principales voies de transmission.

D'autres puzzles sont également présents, tels que des échantillons identiques de deux patients dont l'un était positif cinq jours plus tôt. Pourtant, l'autre échantillon avait une histoire de voyages aux États-Unis, et ils n'ont aucun lien connu! Cela peut signifier que le dernier échantillon n'était pas dû aux voyages aux États-Unis après tout.

Implications

Malgré les limites de l'étude, comme le manque de données sur les porteurs asymptomatiques et les écarts dans la collecte de données qui mènent à des antécédents de voyage et de contact incomplets, il reste la première discussion sur les génomes viraux liés au COVID-19 de cette partie du Canada. , y compris bon nombre des premiers cas là-bas.

L'étude soulève des questions quant à l'adéquation des explications traditionnelles de l'infection, comme le contact avec des voyageurs en provenance de pays étrangers avec une charge d'infection plus élevée, ou l'auto-voyage. Bien que cela puisse être vrai, l'étude suggère que le transfert communautaire a peut-être déjà eu lieu au début de l'évolution de l'épidémie.

L'étude conclut: «Ces résultats démontrent comment l'épidémiologie moléculaire et la phylogénétique évolutive peuvent aider les unités de santé locales à suivre les origines et les vecteurs de propagation de maladies émergentes comme le SRAS-CoV-2. La détection et le dépistage plus tôt et les modes alternatifs de recherche des contacts peuvent améliorer l'efficacité des interventions régionales de santé publique pour prévenir de futures pandémies. »

*Avis important

bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé, ou traités comme des informations établies.

Vous pourriez également aimer...