Une nouvelle technique de calcul différencie avec précision les données des cellules tumorales et des cellules normales

Dans le but de relever un défi majeur lors de l’analyse de grands ensembles de données de séquençage d’ARN unicellulaire, des chercheurs de l’Université du Texas MD Anderson Cancer Center ont développé une nouvelle technique de calcul pour différencier avec précision les données des cellules cancéreuses et la variété de cellules normales trouvées dans les échantillons de tumeurs. Le travail a été publié aujourd’hui dans Biotechnologie de la nature.

Le nouvel outil, baptisé CopyKAT (caryotypage en nombre de copies des tumeurs aneuploïdes), permet aux chercheurs d’examiner plus facilement les données complexes obtenues à partir de grandes expériences de séquençage d’ARN monocellulaire, qui fournissent des données d’expression génique à partir de plusieurs milliers de cellules individuelles.

CopyKAT utilise ces données d’expression génique pour rechercher une aneuploïdie ou la présence de nombres de chromosomes anormaux, ce qui est courant dans la plupart des cancers, a déclaré l’auteur principal de l’étude Nicholas Navin, Ph.D., professeur agrégé de génétique et bioinformatique et biologie computationnelle. L’outil permet également d’identifier des sous-populations distinctes, ou clones, au sein des cellules cancéreuses.

Nous avons développé CopyKAT comme un outil pour déduire des informations génétiques à partir des données du transcriptome. En appliquant cet outil à plusieurs ensembles de données, nous avons montré que nous pouvions identifier sans ambiguïté, avec une précision d’environ 99%, les cellules tumorales par rapport aux autres cellules immunitaires ou stromales présentes dans un échantillon de tumeur mixte. Nous pourrions alors aller plus loin pour découvrir les sous-clones présents et comprendre leurs différences génétiques. «

Nicholas Navin, Ph.D., professeur agrégé de génétique et bioinformatique et biologie computationnelle

Historiquement, les tumeurs ont été étudiées comme un mélange de toutes les cellules présentes, dont beaucoup ne sont pas cancéreuses. L’avènement du séquençage d’ARN unicellulaire ces dernières années a permis aux chercheurs d’analyser les tumeurs avec une résolution beaucoup plus grande, en examinant l’expression génique de chaque cellule individuelle pour développer une image du paysage tumoral, y compris le microenvironnement environnant.

Cependant, il n’est pas facile de faire la distinction entre les cellules cancéreuses et les cellules normales sans une approche informatique fiable, a expliqué Navin. L’ancien chercheur postdoctoral Ruli Gao, Ph.D., maintenant professeur adjoint de sciences cardiovasculaires au Houston Methodist Research Institute, a développé les algorithmes CopyKAT, qui améliorent les techniques plus anciennes en augmentant la précision et en s’ajustant pour la dernière génération de données de séquençage d’ARN monocellulaire .

L’équipe a d’abord évalué son outil en comparant les résultats aux données de séquençage du génome entier, qui ont montré une grande précision dans la prédiction des changements du nombre de copies. Dans trois ensembles de données supplémentaires sur le cancer du pancréas, le cancer du sein triple négatif et le cancer de la thyroïde anaplasique, les chercheurs ont montré que CopyKAT était précis dans la distinction entre les cellules tumorales et les cellules normales dans des échantillons mixtes.

Ces analyses ont été rendues possibles grâce à des collaborations avec Stephen Y. Lai, MD, Ph.D., professeur de chirurgie de la tête et du cou, ainsi que Stacy Moulder, MD, professeur d’oncologie médicale du sein et le Breast Cancer Moon Shot^®, qui fait partie du Moon Shots Program® de MD Anderson, un effort de collaboration visant à transformer rapidement les découvertes scientifiques en avancées cliniques significatives qui sauvent la vie des patients.

En analysant ces échantillons, les chercheurs ont également montré que l’outil est efficace pour identifier les sous-populations de cellules cancéreuses dans la tumeur en fonction des différences de nombre de copies, comme l’ont confirmé des expériences sur les cancers du sein triple négatifs.

« En utilisant CopyKAT, nous avons pu identifier des sous-populations rares dans les cancers du sein triple négatifs qui ont des altérations génétiques uniques qui ne sont pas largement rapportées, y compris celles qui ont des implications thérapeutiques potentielles », a déclaré Gao. « Nous espérons que cet outil sera utile à la communauté de recherche pour tirer le meilleur parti de leurs données de séquençage d’ARN unicellulaire et pour conduire de nouvelles découvertes dans le cancer. »

L’outil est disponible gratuitement ici pour les chercheurs. Les auteurs notent que l’outil n’est pas applicable à l’étude de tous les types de cancer. L’aneuploïdie, par exemple, est relativement rare dans les cancers pédiatriques et hématologiques.

La source:

Université du Texas MD Anderson Cancer Center

Référence du journal:

Gao, R., et coll. (2021) Délimitation du nombre de copies et de la sous-structure clonale dans les tumeurs humaines à partir de transcriptomes unicellulaires. Biotechnologie de la nature. doi.org/10.1038/s41587-020-00795-2.