On pense que la pandémie en cours du syndrome respiratoire aigu sévère grave (coronavirus 2) (SARS-CoV-2) est originaire d'une espèce animale, très probablement des chauves-souris, qui a réussi à se propager à l'homme. Cependant, l'espèce exacte d'origine n'a pas encore été confirmée.
Une nouvelle étude publiée sur le serveur de préimpression bioRxiv * en mai 2020 identifie huit mutations dans le génome viral ainsi que leur degré de réussite dans la population mondiale du virus.
Le génome du virus SARS-CoV-2 est d'environ 30 kB, avec plus des deux tiers composés de gènes pour des protéines non structurelles. Le tiers restant code pour les protéines de pointe, d'enveloppe, de membrane ou de nucléocapside.
La séquence du virus a été générée pour la première fois en quelques semaines à partir du premier cas connu, et en un peu plus de quatre mois, plus de 16 000 séquences ont été téléchargées dans des banques de données universelles.
Sommaire
Comprendre les mutations des protéines virales
La présente étude visait à déterminer les substitutions d'acides aminés très répandues dans les protéines virales à partir des séquences disponibles de SRAS-CoV-2 conformément à la chronologie connue de la pandémie. Celles-ci ont été évaluées en fonction de leur importance pour l'aptitude virale.
Les séquences SARS-CoV-2 pour l'étude provenaient de la base de données GISAID et comprenaient les 12562 séquences complètes de haute qualité disponibles le 3 mai 2020, classées par ordre chronologique d'isolement. Les chercheurs ont également utilisé une séquence de référence de SARS-CoV, de pangolin et de civette, et trois de coronavirus de chauve-souris, à l'aide de Genbank.
L'étape suivante consistait à analyser les mutations non synonymes et à sélectionner celles appropriées pour une étude plus approfondie. Les chercheurs ont arbitrairement fixé le jour où la première substitution d'acides aminés a été signalée fin février 2020 comme représentative d'une date précoce de la pandémie. Ils ont également choisi arbitrairement une fréquence de coupure de 10% pour déterminer si un changement d'acides aminés devait être qualifié de généralisé.
Après avoir fixé ces limites, ils ont choisi toute substitution, qui était «répandue» après cette «date anticipée» pour étude. Ils ont également noté la distribution continentale des variantes identifiées pour étudier leur situation géographique.
Chaque substitution a été analysée en l'alignant sur les protéines correspondantes des coronavirus suivants: chauve-souris, pangolin, civette et SRAS, pour identifier l'emplacement du changement, que ce soit dans les régions conservées ou variables.
Qu'ont découvert les chercheurs?
L'étude a montré huit substitutions d'acides aminés à travers le génome viral, apparues avant la fin de la première phase de la pandémie. Ceux-ci s'étalent dans 10% des isolats connus.
Sept d'entre eux étaient dans des protéines structurales et un dans une protéine non structurale. Quatre étaient présents en janvier en Chine, les autres en Europe à la seconde quinzaine de février mais sur d'autres continents à la fin de la semaine prochaine.
Une mutation a été trouvée dans presque tous les échantillons, à savoir Asp614Gly dans la protéine de pointe. Cependant, toutes les mutations ont été trouvées sur tous les continents à l'exception de 175Met, qui n'a pas été trouvé en Afrique.
La plupart des mutations ont été trouvées dans des sites conservés à la fois dans le SRAS et dans des coronavirus similaires.
En comparaison avec les principaux changements d'acides aminés dans les séquences de phases précoces, intermédiaires et tardives de l'épidémie de SRAS, les chercheurs ont constaté que les mutations non synonymes qui sont devenues courantes dans la majorité des SARS-CoV semblaient différentes. Parmi 11 substitutions qui se sont généralisées, presque toutes étaient dans des protéines non structurales, mais trois ont affecté la protéine de pointe. Bien qu'ils aient été trouvés dans des positions conservées des génomes des chauves-souris et des civettes CoV, ce n'était pas le cas avec le pangolin CoV.
Modifications de la structure 3-D de la protéine S dans les protéines d'origine (A) et mutantes (B). Les images montrent des résidus d'acides aminés à une distance de 20 À de Asp614 (A) ou Gly614 (B) et leur distance à Thr859.
Comment les mutations ont-elles affecté la structure ou la fonction des protéines?
Les chercheurs ont construit des modèles pour les protéines de pointe originales et mutantes, évalué leur précision et recherché des changements dans la structure physique ainsi que les distances interatomiques pour étudier divers aspects de la protéine. Par exemple, si la mutation affectait des sites ou des motifs de phosphorylation, cela pourrait les aider à décider de sa neutralité ou de sa nocivité.
Des altérations de la structure secondaire de la protéine ont également été prévues. Si la mutation était dans ou à proximité d'un site connu pour servir d'antigène, l'impact sur l'antigène a également été évalué à l'aide d'un logiciel de prédiction approprié.
Les chercheurs ont également constaté que la mutation Asp614Gly est devenue presque universellement répandue fin avril 2020. Cette mutation se trouve dans le domaine S1 de la protéine S ou spike et se traduit par une structure plus détendue avec une cavité, mais sans aucune différence dans la potentiel antigénique de l'épitope.
La protéine N ou nucléocapside a montré une double substitution, qui est devenue plus importante au cours de la pandémie, qui ne devrait cependant pas avoir d'effet significatif.
Dans la protéine M ou matrice, la mutation consistait en la substitution de Thr175 par Met175. Il a été prédit qu'il s'agissait d'un site de phosphorylation potentiel, la mutation étant censée être nocive. Ceci était présent avec la mutation 203KR204 dans 98% des cas. L'effacement rapide de cette mutation soutient la réduction de la capacité virale qui lui est associée.
D'autres mutations devraient également être neutres.
Des mutations couramment trouvées dans les sites préservés du SRAS-Cov-2 affectent
Les chercheurs considèrent la pandémie actuelle comme un exemple du pire des cas où un nouvel agent infectieux émerge dans une population sans aucune immunité, conduisant à une transmission très rapide avec une pression de sélection insignifiante de la réponse immunitaire. Dans de telles circonstances, on s'attendrait à ce que de nombreuses variantes différentes du virus apparaissent, les mutations qui augmentent la forme virale devraient gagner en importance.
Les chercheurs ont arbitrairement déterminé des critères de coupure pour distinguer les erreurs de séquençage et les substitutions aléatoires de celles qui pourraient affecter la forme virale de manière beaucoup plus significative. Il comporte le risque inhérent que certaines mutations moins courantes soient négligées.
L'étude montre que 7 des 8 mutations trouvées en évidence se produisent dans des résidus hautement conservés dans les coronavirus qui sont liés les uns aux autres. Cela devrait indiquer leur impact élevé sur la réplication virale et la survie, mais une différence significative par rapport à celles trouvées dans le SRAS-CoV est qu'elles se sont accumulées dans les protéines structurelles.
Les chercheurs commentent: «Fait intéressant, la plupart de ces mutations se sont estompées, à l'exception de l'Asp614Gly dans la protéine S qui est devenue prédominante, ce qui suggère qu'elle a contribué à la forme virale. Certains autres continuent d'augmenter leur prévalence. » Ces informations peuvent aider à suivre le SRAS-CoV-2 car il continue de changer et de se propager dans différentes populations.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé, ou traités comme des informations établies.