La pandémie de coronavirus 2 du syndrome respiratoire aigu sévère (SARS-CoV-2) qui affecte actuellement le monde entier est issue d'une famille de virus communs et qui infectent uniquement les mammifères et les oiseaux. Il existe 46 espèces connues, dont 7 seulement sont capables d'infection humaine. Il s'agit notamment des virus du SRAS et du MERS, ainsi que du virus SARS-CoV-2 actuellement en circulation. Qu'est-ce qui rend certains virus capables d'infecter les humains alors que d'autres restent confinés aux animaux?
Une nouvelle étude publiée sur le serveur de préimpression bioRxiv * en juin 2020 rapporte quelques résultats importants qui pourraient éclairer cette question. Alors que la pandémie progresse, ayant fait plus de 500 000 morts et causé plus de 10 millions d'infections à ce jour, la tâche de définir et de prédire les facteurs qui prédisposent à l'infectiosité entre les espèces devient de plus en plus critique.
Haute infectivité de COVID-19
En comparaison avec le SRAS ou le MERS, le SARS-CoV-2 est un virus beaucoup plus infectieux chez l'homme. La présente étude vise à comprendre d'où elle provient et comment elle s'est adaptée aux hôtes humains de manière efficace. Cela pourrait aider à contrôler l'infection ainsi qu'à développer des stratégies antivirales et des vaccins efficaces.
Le virus qui cause la maladie COVID-19 est très similaire au virus antérieur qui a causé le SRAS, mais encore plus identique au coronavirus de chauve-souris (CoV) nommé RaTG13 dans la séquence du gène spike (S). La similitude est particulièrement notable dans les régions inter-gènes. Pourtant, il existe des différences essentielles dans les structures génomiques vitales, telles que l'insertion d'un site de clivage de la furine polybasique à la jonction entre les sous-unités S1 et S2 de la protéine S.
Chauve-souris intermédiaire en fer à cheval (Rhinolophus affinis). Crédit d'image: Binturong-tonoscarpe / Shutterstock
Ainsi, même si la plupart des chercheurs soutiennent l'identité de la chauve-souris comme réservoir pour plusieurs CoV, y compris le SARS-CoV, l'hôte réservoir du virus actuel est inconnu. La protéine de pointe est la clé de l'entrée du SARS-CoV-2. Il forme des structures homotrimériques qui dépassent de la membrane de surface virale. Ce sont les molécules de reconnaissance du récepteur ACE2 humain de la cellule hôte.
Spike Protein et ACE2
Cette liaison spike-ACE2 déclenche la fusion de la membrane et l'entrée virale dans la cellule hôte. La protéine de pointe est composée de deux sous-unités, S1 et S2, le domaine de liaison au récepteur (RBD) étant situé sur S1. Cela se lie à la molécule ACE2. Cela active les changements de conformation qui conduisent à l'endocytose du virus et à la fusion membranaire, libérant le virus pour infecter la cellule hôte.
Cette séquence clé de RBD est la partie la plus diversifiée du génome viral et contient 6 acides aminés, qui sont essentiels pour se lier au récepteur ACE2, et peut-être pour traverser les barrières d'espèces pour infecter d'autres hôtes.
Comme avec le précédent SARS-CoV, des mutations se sont produites dans le RBD lors de son adaptation à différentes cellules hôtes le long de la chaîne de transmission. La présente étude explore ces mutations pour comprendre ce mécanisme au niveau moléculaire. En bref, la capacité de liaison de la protéine de pointe au récepteur ACE2 détermine la facilité avec laquelle le virus se propage à travers différentes espèces.
Polymorphisme identifié dans la protéine de pointe RBD mappé à la structure de la protéine de pointe dans le SRAS-CoV-2 en complexe avec ACE2 chez l'homme. Cyan = protéine de pointe, Orange = liaison directe ACE2 à la protéine de pointe. Mutations de 23 points provoquant un changement significatif d'affinité sur la liaison directe de la protéine de pointe du SARS-CoV-2, le bleu présente une affinité décroissante tandis que le violet montre une augmentation.
L'étude: Tracer l'adaptation via des mutations structurelles de protéines
Les objectifs de l'étude sont: la description de la relation phylogénétique de différentes variantes du SRAS-CoV-2 dans diverses populations, et les polymorphismes nucléotidiques de différentes régions du génome viral, à savoir les régions S, M, N et E ; développer une méthode prédictive pour trouver les mutations du gène S qui confèrent une capacité adaptative au virus, ainsi que les différences de stabilité de mutation et d'affinité de liaison; et pour déterminer la possibilité de variantes ACE2 qui altèrent la liaison virale et donc son pouvoir infectieux.
La population étudiée comprenait 1 000 habitants chinois et autres sujets. Les variantes ACE2 ont été analysées pour évaluer leur capacité de liaison. Les chercheurs ont également prédit les affinités de liaison de ces variantes pour comprendre si ces changements les rendent résistants ou sensibles au virus.
Les auteurs de l'étude ont construit un arbre phylogénique à maximum de vraisemblance (ML) sur la base de 2147 génomes, ce qui a montré qu'il était étroitement lié au CoV de la chauve-souris RaTG13 et au CoV du pangolin. De façon frappante, au niveau moléculaire, il n'y a pas de relation étroite entre SARS-CoV-2 et SARS-CoV.
Les chercheurs ont également reconstruit l'arbre à partir des gènes structurels codant pour les protéines. Ils sont arrivés à la conclusion que le processus évolutif pourrait ne pas être aussi important pour décider de la phylogénie de ces protéines par rapport à l'adaptation des protéines fonctionnelles.
Mutations des protéines S et leurs effets
Ils ont constaté qu'il y avait 23 mutations ponctuelles dans le gène S qui ont influencé l'affinité et la stabilité de la protéine S, 9 améliorant et 14 affectant négativement ces propriétés.
Ils ont également examiné 1150 variants de la protéine S rapportés par le CDC et ont découvert que parmi 76 mutations faux-sens dans une seule région, cinq ont amélioré sa liaison d'affinité et seulement trois ont augmenté la stabilité du complexe. En examinant les séquences du génome qui abritaient ces mutations, celles-ci se sont révélées être proches de la position de la chauve-souris du SRAS et du pangolin du SRAS dans l'arbre phylogénétique.
Des études antérieures montrent que le SARS-CoV-2 a une affinité et une viabilité plus élevées que le SARS-CoV dans l'air et sur les surfaces, peut-être parce que le premier pourrait mieux s'adapter à la propagation humaine. Les résultats actuels le confirment en ce qui concerne la protéine S.
Encore une fois, la conclusion selon laquelle la protéine SARS-CoV-2 S est la plus étroitement liée à celle du virus de la chauve-souris en fer à cheval RaTG13, puis au virus du pangolin, rejoint les recherches antérieures, renforçant la conclusion selon laquelle il est peu probable que ce dernier soit le ou seulement l'hôte intermédiaire du virus. En fait, l'insertion de l'insertion du site de clivage polybasique de la furine unique à l'interface S1 / S2 aurait pu être acquise lors du passage à travers un hôte intermédiaire inconnu.
Les différentes variantes de la protéine de pointe observées dans différents pays suggèrent, selon l'analyse phylogénétique, que l'infection d'origine aurait pu se produire sur plusieurs sites plutôt que seulement à Wuhan. Les chercheurs avertissent cependant que beaucoup plus de données sont nécessaires pour compléter cette direction d'étude.
Implications et applications
Ils ont également trouvé des variantes de l'ACE2, qui, cependant, n'ont affecté ni l'affinité ni la stabilité. En conséquence, ils suggèrent que «le taux de mortalité est également plus susceptible d'être lié aux conditions médicales et de santé et à l'état physique des patients» qu'à la variante ACE2.
Ils concluent: «L'analyse partagée dans cette étude fournirait des informations génétiques utiles pour suivre les mutations qui se produisent dans la protéine de pointe du SRAS-CoV-2 et empêcher la récurrence de cette épidémie, de plus, protéger les êtres humains contre l'infection zoonotique à coronavirus.»
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé, ou traités comme des informations établies.