La modélisation indique que les structures secondaires de l'ARN dans les gènes codant pour les protéines Nsp4 et Nsp16 du coronavirus 2 du syndrome respiratoire aigu sévère (SARS-CoV-2) sont différentes des autres espèces de coronavirus apparentées, ce qui peut affecter certains processus moléculaires viraux.
Avec la propagation spectaculaire du COVID-19 causée par le coronavirus SRAS-CoV-2, il y a eu une poussée pour comprendre comment un virus peut infecter de nouveaux hôtes et ce qui le rend différent des autres coronavirus.
Une façon de faire est de déterminer quelles parties du génome viral ont été naturellement sélectionnées pour évoluer et sont différentes des espèces ancêtres et quelles parties ont été sélectivement retirées du génome.
Des études antérieures ont trouvé un mélange d'évolution sélective et d'élimination dans les gènes codant pour la protéine de pointe du coronavirus SARS-CoV-2. La protéine de pointe aide le virus à envahir et infecter la cellule hôte en se fixant à l'enzyme de conversion de l'angiotensine 2 (ACE2).
Cependant, il existe d'autres processus critiques dans les virus à ARN, comme le coronavirus, qui ne sont pas contrôlés par les séquences protéiques. Les tests standard pour déterminer les mutations peuvent détecter des changements dans les protéines virales, mais n'incluent pas les molécules d'ARN avec lesquelles les protéines interagissent pour différents processus.
Mutations trouvées dans la protéine de pointe
Pour enquêter sur les mutations des coronavirus, une nouvelle étude menée par des scientifiques de l'Université Duke et publiée sur le serveur de pré-impression bioRxiv *, A utilisé une méthodologie de calcul, adaptiPhy, qui identifie des substitutions nucléotidiques supplémentaires dans certaines parties du génome viral par rapport aux mutations qui n'ont aucun effet sur le génome. En utilisant adaptiPhy, l'équipe a identifié des régions de génomes de différents Sarbécovirus espèces de chauve-souris, pangolin et hôtes humains, qui auraient pu être sélectionnées positivement, ou mutations avantageuses. Pour le nouveau coronavirus SARS-CoV-2, ils ont utilisé environ 5000 séquences génomiques de la base de données NCBI Virus.
L'équipe a également étudié les changements dans les structures des protéines Nsp4 et Nsp16 au niveau de l'ARN et des protéines à l'aide de la modélisation.
En utilisant différentes méthodes de calcul, les chercheurs ont découvert que le signal le plus important était pour le gène qui code la protéine de pointe, montrant une sélection positive dans toutes les espèces testées. Ceci est similaire à ce que d'autres études ont rapporté.
Dans le virus SARS-CoV-2, ils ont trouvé une sélection positive dans quatre régions du gène de la protéine de pointe. L'un était un changement dans la structure entière du domaine de liaison au récepteur (RBD), qui se lie aux cellules hôtes. Un autre était un changement de site nécessaire pour infecter les cellules pulmonaires.
Ceci est différent des changements trouvés dans SARS-CoV et Bat-CoV-LYRa11. Dans ces virus, une sélection positive s'est produite dans les régions pour le camouflage viral et celles qui permettent l'entrée du virus dans la cellule hôte.
Ces mutations suggèrent que les virus se sont adaptés pour différents hôtes, le SARS-CoV-2 s'adaptant pour se lier à la protéine ACE2 chez divers hôtes.
Sélection positive dans les protéines
Les auteurs ont également trouvé une sélection positive dans les gènes codant pour deux protéines, Nsp4 et Nsp16, ce qui n'avait jamais été vu auparavant. Dans Nsp4, ils ont trouvé deux substitutions de nucléotides, la valine en alanine et la valine en isoleucine. La modélisation a suggéré que ces changements n'avaient pas d'impact significatif sur la structure secondaire ou tertiaire de la protéine dans le SRAS-CoV-2 par rapport à d'autres espèces. Dans Nsp16, ils n'ont pas trouvé de telles substitutions. Cependant, aucun de ces changements n'affecte probablement la structure ou les fonctions de ces protéines, écrivent les auteurs.
Il est donc possible que la sélection positive soit due à des changements dans la structure et la fonction de l'ARN.
Nsp16 a une seule région bien pliée, qui est la seule région de ce type qui est également conservée dans d'autres espèces de coronavirus apparentées. Nsp4 a deux régions assez bien repliées. Ainsi, il est probable que ces structures repliées soient liées à des fonctions virales.
« Nos prédictions d'énergie libre minimale (MFE) révèlent que la structure secondaire probable du génome ARN dans la région des gènes Nsp4 et Nsp16 diffère probablement parmi les six espèces de coronavirus que nous avons examinées », écrivent les auteurs.
Il y avait également des différences entre les espèces dans l'entropie dans les régions de sélection positive, suggérant des différences dans la stabilité des molécules repliées.
«Ensemble, ces nouveaux résultats indiquent que les régions repliées de Nsp4 et Nsp16 dans le génome du SRAS-Cov-2 peuvent différer par la forme de celles des coronavirus apparentés», écrivent les auteurs.
Cependant, la façon dont ces changements, qui sont propres au SRAS-CoV-2, sont liés à des fonctions moléculaires spécifiques, ne peut pas encore être déterminée, car les fonctions moléculaires des structures secondaires des coronavirus ne sont pas bien connues aujourd'hui.
Étant donné que des études antérieures indiquent que ces régions ont des rôles fonctionnels, les changements peuvent affecter les fonctions du génome ou de la transcription. Cependant, les véritables rôles de ces adaptations dans les protéines structurales doivent être étudiés plus avant expérimentalement.
*Avis important
bioRvix publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique / les comportements liés à la santé, ou traités comme des informations établies.