Des diagnostics améliorés sont importants pour contenir la pandémie de coronavirus en cours de 2019 (COVID-19) ainsi que pour comprendre la biologie de l’agent pathogène causal, le virus du coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2).
Une nouvelle étude intéressante menée par des chercheurs de l’Université de Liverpool, de l’Université de Bristol et de Public Health England au Royaume-Uni décrit un nouvel outil bioinformatique utilisé pour détecter les séquences d’acide ribonucléique messager subgénomique (ARNm) du virus. Cela peut aider à développer de nouveaux outils de diagnostic et à modéliser la transmission du virus.
De nombreuses études ont rapporté les résultats du séquençage viral et des bases de données publiées sont disponibles à titre de référence. Ceux-ci peuvent être analysés plus en détail en utilisant la bioinformatique pour explorer la biologie virale.
Les chercheurs ont publié leurs résultats sur le bioRxiv* serveur de pré-impression.
Sommaire
Séquences Leader-TRS dans l’ARN viral
Le génome de l’ARN viral comprend les deux tiers à l’extrémité 5 ‘et le tiers restant à l’extrémité 3’. Le premier code pour plusieurs protéines structurales, non structurales et accessoires virales, dont beaucoup sont essentielles à la synthèse de l’ARN viral.
Ce dernier est exprimé comme un ensemble de séquences d’ARNm sous-génomiques, imbriquées les unes dans les autres. Ils ont les mêmes extrémités 5 ‘et 3’ que le génome du coronavirus et ont une séquence leader. Le sgmRNA à l’extrémité 3 ‘code pour la nucléoprotéine et est plus abondant que celui trouvé juste après le sgmRNA qui code pour le cadre de lecture ouvert (ORF) 1ab. Sa fréquence est également supérieure à celle du génome lui-même.
La synthèse des sgmRNA se fait via une séquence de régulation transcriptionnelle (TRS) trouvée immédiatement adjacente à la séquence leader 5 ‘. Ces TRS se trouvent le long du génome, à proximité des codons de départ des ORF, contenant un motif ACGAAC à noyau court avec des séquences flanquantes.
La plupart des chercheurs considèrent que le sgmRNA est synthétisé par transcription discontinue, laissant une empreinte sous la forme de complexes leader / sgmRNA. Ceux-ci peuvent être séquencés pour évaluer l’abondance du sgmRNA.
Par exemple, dans un écouvillon nasopharyngé ou d’autres échantillons cliniques infectés, la détection de tels complexes pourrait permettre des conclusions sur la synthèse active d’ARN viral.
Outil LeTRS
L’étude actuelle est basée sur l’utilisation de l’outil bioinformatique LeTRS, développé pour identifier les sites uniques de jonction du gène leader-TRS pour chacun des sgmRNA viraux, à partir des ensembles de données disponibles de séquences virales dans des cultures de cellules infectées.
Celles-ci ont été utilisées comme mesures de substitution de l’abondance de l’ARNm sg. Après la validation de l’outil, celui-ci a été testé sur des cellules infectées à partir d’une culture cellulaire réalisée pour cette étude et à partir d’échantillons nasopharyngés obtenus à partir de modèles humains infectés et de primates non humains (PSN).
Quels sont les résultats?
Les résultats ont montré que dans les trois cas, le sgmRNA codant pour la nucléoprotéine était le plus abondant, tandis que l’ORF7b et l’ORF10 étaient les moins nombreux. Les sites de jonction leader-TRS avec le plus grand nombre de lectures reflétaient les positions de référence, à l’exception de ORF7b obtenu par l’outil de séquençage Nanopore.
Nouveaux sgmRNA potentiels
Les chercheurs ont également observé plusieurs complexes leader-TRS à faible abondance, indiquant qu’ils représentent de nouveaux sgmRNA d’abondance moindre ou des sgmRNA déjà connus avec différentes jonctions leader-TRS.
Une autre possibilité est qu’ils proviennent d’un changement de transcription virale ou sont simplement des résultats accidentels des différents processus de séquençage utilisés. De nouvelles jonctions leader-TRS ont été trouvées avec d’autres coronavirus.
Pour valider la présence d’un nouveau sgmRNA, la protéomique doit correspondre au sgmRNA pour garantir que la séquence reflète un ORF réel. Par exemple, des chercheurs antérieurs ont parfois identifié un nouvel ARN supposé, représentant la région 5 ‘de ORF1ab. Cependant, il s’agit probablement de modèles de réplication contenant de l’ARN défectueux.
Ces auteurs ont également suggéré que la transcription promiscuité des jonctions leader-TRS se produit en fin d’infection. Cela pourrait expliquer le manque de correspondance entre les cellules d’échantillons nasopharyngiens tardifs dans les modèles de PSN et chez l’homme, et à partir de données publiées, par rapport aux cellules obtenues à des stades précoces de l’infection.
Autres avantages de LeTRS
Les chercheurs ont utilisé le séquençage d’amplicon pour identifier correctement les véritables jonctions leader-TRS dans les lectures de séquençage. Cependant, différentes méthodes de séquençage ont fonctionné différemment à cet égard. La présence de séquences de poly-adénine (polyA) et de jonctions leader-TRS sont des indices utiles de la présence de sgmRNA pleine longueur dans les échantillons de test.
L’étude montre également que LeTRS peut filtrer les faux positifs car il n’a eu aucune lecture positive lorsqu’il est testé par rapport aux données de séquençage de cellules témoins saines.
Les avantages de LeTRS incluent la réduction de la durée de fonctionnement de l’unité centrale du système informatique, avec une plus grande richesse d’informations, par rapport aux outils disponibles jusqu’à présent. Il est donc idéal pour l’analyse à haut débit de grandes quantités de données de séquençage provenant de différentes sources.
Applications de LeTRS
La présence de sgmRNA dans le matériel clinique indique la présence de cellules infectées et fournit ainsi des signes de synthèse d’ARN viral actif en cours au moment de l’échantillonnage. Cependant, la présente étude montre que si les jonctions leader-TRS sont identifiées dans ces échantillons, leur rapport diffère de celui des cellules infectées.
L’hypothèse antérieure peut être modifiée ainsi:
Si l’abondance des jonctions du gène leader-TRS suit un schéma attendu de la jonction du gène leader-TRS du gène nucléoprotéique étant la plus abondante suivie d’un gradient général dans les données de séquence d’échantillons nasopharyngiens, cela peut indiquer une infection active. «
L’utilisation de modèles de PSN permet de retracer l’infection par le SRAS-CoV-2 à partir d’un temps d’exposition connu. L’utilisation de LeTRS sur l’ARN séquencé à partir de deux modèles de NHP a montré la synthèse phasique du sgmRNA, l’abondance diminuant considérablement après le 8ème ou le 9ème jour.
Cela peut indiquer une infection synchrone des cellules épithéliales respiratoires au début, conduisant à la mort cellulaire. Les nouveaux virions se propagent à d’autres cellules épithéliales. Cela conduit à des augmentations exponentielles de l’infection par ondes asynchrones.
La baisse du sgmRNA coïncide avec l’augmentation des titres d’anticorps neutralisants, à mesure que l’immunité humorale entre en jeu. Ce schéma suit celui observé dans le suivi sérologique des patients COVID-19.
Quelles sont les implications?
Les résultats de cette étude peuvent aider à identifier de nouvelles cibles pour les tests de diagnostic basés sur les acides nucléiques, qui ciblent souvent l’ORF1ab, la nucléoprotéine et les gènes de pointe. Si les trois sont équivalents, la détection de nucléoprotéine à une abondance plus élevée que le gène de pointe pourrait indiquer la présence de cellules infectées.
Les valeurs de seuil de cycle inférieur (Ct) obtenues lors des tests avec l’étalon-or actuel, la réaction en chaîne transcriptase-polymérase inverse (RT PCR), peuvent indiquer non seulement des charges virales plus élevées, mais un nombre plus élevé de cellules infectées. Pour distinguer ces possibilités, les rapports relatifs des sgmRNA doivent être identifiés.
Enfin, la nature phasique de la transcription et l’abondance de la jonction N leader-TRS dans de nombreux échantillons humains mettent en garde contre les modèles de transmission virale basés uniquement ou dans une large mesure sur les valeurs de Ct virales, qui varieront énormément dans les différentes phases.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique / les comportements liés à la santé, ou traités comme des informations établies.
Comment l’acide acétylsalicylique et la warfarine interagissent-ils avec divers nutriments ?