Différentes variantes du SRAS-CoV-2 identifiées dans les eaux usées de la baie de San Francisco

Une équipe de scientifiques de l'Université de Californie, de Berkeley, de l'Innovative Genomics Institute, d'Illumina, Inc. et de l'Université de Stanford a effectué un séquençage génomique du coronavirus 2 du syndrome respiratoire aigu sévère (SARS-CoV-2) collecté dans les eaux usées de San Francisco Région de la baie. Les résultats de l'étude indiquent que les génotypes détectés dans les eaux usées sont identiques aux génotypes détectés dans les échantillons cliniques obtenus dans cette région. L'étude est actuellement disponible sur le medRxiv * serveur de pré-impression.

Le séquençage génomique de l'ARN du SRAS-CoV-2 est une approche importante pour déterminer l'évolution virale et la dynamique de transmission. Lors de la période initiale de la pandémie de maladie à coronavirus 2019 (COVID-19) aux États-Unis, l'ensemble des données de séquençage du génome du SRAS-CoV-2 a révélé qu'il y avait plusieurs événements d'introduction virale à New York et en Californie. De plus, la fréquence de transmission communautaire est plus élevée pour un type particulier de génotype viral après sa première introduction dans l'État de Washington. De plus, des souches distinctes de SRAS-CoV-2 ont été identifiées dans un seul quartier de San Francisco.

Compte tenu de la présence d'ARN du SRAS-CoV-2 dans les matières fécales humaines, l'estimation de l'abondance virale dans de nombreuses régions municipales a été entreprise par séquençage des eaux usées basé sur la transcriptase inverse-polymérase (RT-qPCR).

Virus caractérisés détectés dans les métatranscriptomes des eaux usées enrichis et non enrichis. Abondances relatives de virus avec des hôtes eucaryotes dans la base de données RefSeq en pourcentage du total des lectures de séquençage dérivées de l'échantillon dans (a) ultrafiltration amicon (fractionnement viral) et (b) colonne d'ARN total et lait d'échantillons de silice. Tous les échantillons ont été enrichis avec le panel Illumina Respiratory Virus. (c) Abondances relatives de virus RefSeq dans la métatranscriptomique non enrichie (à gauche) et les mêmes échantillons après oligo-enrichissement avec l'Illumina Respiratory Virus Panel. (d) La relation entre la quantité de copies du génome viral dans 40 μL d'ARN purifié et l'exhaustivité du génome du SRAS-CoV-2 (mesurée en largeur de couverture) pour chaque échantillon. Les échantillons sont colorés par la méthodologie d'extraction et la taille du point correspond à la profondeur de couverture moyenne du SRAS-CoV-2.

Virus caractérisés détectés dans les métatranscriptomes des eaux usées enrichis et non enrichis. Abondances relatives de virus avec des hôtes eucaryotes dans la base de données RefSeq en pourcentage du total des lectures de séquençage dérivées de l'échantillon dans (a) ultrafiltration amicon (fractionnement viral) et (b) colonne d'ARN total et lait d'échantillons de silice. Tous les échantillons ont été enrichis avec le panel Illumina Respiratory Virus. (c) Abondances relatives de virus RefSeq dans la métatranscriptomique non enrichie (à gauche) et les mêmes échantillons après oligo-enrichissement avec l'Illumina Respiratory Virus Panel. (d) La relation entre la quantité de copies du génome viral dans 40 μL d'ARN purifié et l'exhaustivité du génome du SRAS-CoV-2 (mesurée en largeur de couverture) pour chaque échantillon. Les échantillons sont colorés par la méthodologie d'extraction et la taille du point correspond à la profondeur de couverture moyenne du SRAS-CoV-2.

Conception de l'étude actuelle

Pour identifier l'abondance virale et la prévalence du génotype dans diverses régions de la baie de San Francisco, l'étude actuelle a réalisé un séquençage génomique de l'ARN du SRAS-CoV-2 isolé directement des eaux usées. Les scientifiques ont extrait des concentrés viraux et de l'ARN total à partir d'échantillons composites d'eaux usées brutes collectées entre mai 2020 et juillet 2020.

Observations importantes

Ils ont utilisé des approches de séquençage métagénomique pour détecter l'abondance virale et les variants de nucléotides uniques, et les résultats ont révélé que le SRAS-CoV-2 était présent à des abondances variables (0% – 14%) dans les échantillons d'étude.

Outre le SRAS-CoV-2, d'autres virus humains et végétaux ont été identifiés dans des échantillons d'eaux usées, notamment des bocavirus humains, des virus de type picorna, le virus de la mosaïque verte du concombre et le virus de la marbrure douce du poivre.

Dans environ 31% des échantillons, les scientifiques ont pu obtenir des génomes de SARS-CoV-2 consensuels complets (longueur couverte> 99%). Environ 4 différences de paires de bases ont été observées entre les génomes consensus obtenus du comté d'Alameda et du comté de Marin. Cela indique que les génomes consensus peuvent représenter les lignées prédominantes du SRAS-CoV-2 dans la population étudiée pendant la saison estivale de 2020.

Pour identifier des génotypes viraux alternatifs, les scientifiques ont utilisé un pipeline pour l'appel métagénomique de variant de nucléotide unique et ont identifié différentes variantes génomiques du SRAS-CoV-2 dans chaque échantillon d'eaux usées. Ces variantes étaient identiques à celles obtenues à partir d'échantillons de patients cliniques. Environ 50%, 61% et 71% des variants détectés dans les échantillons d'eaux usées ont également été détectés dans des génomes viraux cliniques obtenus respectivement en Californie et aux États-Unis, ainsi que dans ceux collectés dans le monde entier. Cela indique que la variation génomique réelle du SRAS-CoV-2 dans une population donnée peut être résumée à partir des données de séquençage du génome viral des eaux usées.

Les scientifiques ont également utilisé un test hypergéométrique pour analyser la probabilité de chevauchement par hasard entre les variantes génomiques des eaux usées et les variantes génomiques cliniques dans une région donnée. Ils ont observé que la probabilité de chevauchement non aléatoire était la plus élevée dans le comté d'Alameda.

Fait intéressant, les scientifiques ont observé qu'en plus des variantes génomiques du SRAS-CoV-2 qui étaient identiques dans les échantillons d'eaux usées et de patients cliniques, il y avait quatre variantes récurrentes dans les échantillons d'eaux usées qui n'ont pas été détectées cliniquement en Californie. Cependant, ces variantes sont précédemment identifiées dans d'autres régions des États-Unis et ne semblent être arrivées dans ces régions qu'en juillet 2020. Cela indique que ces variantes pourraient être détectées cliniquement en Californie à l'avenir.

Importance de l'étude

L'étude actuelle révèle que différents génotypes de souches de SRAS-CoV-2 peuvent être identifiés dans des échantillons d'eaux usées. Le séquençage des eaux usées peut même révéler des variantes génétiques qui ne sont toujours pas détectées dans les échantillons cliniques de patients.

Étant donné que la méthode de séquençage des eaux usées ne dépend pas d'amorces de réaction en chaîne par polymérase spécifiques, l'échec de la détection des souches virales avec des mutations peut être évité. En outre, cette approche peut fournir des informations importantes sur la distribution virale au sein d'une population donnée, ainsi que peut révéler l'entrée récente de différents génotypes du SRAS-CoV-2 dans une région donnée.

*Avis important

medRxiv publie des rapports scientifiques préliminaires qui ne sont pas examinés par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé, ou traités comme des informations établies.

Vous pourriez également aimer...