Bruker Corporation annonce aujourd’hui une publication phare des groupes des professeurs Matthias Mann et Fabian Theis dans la revue Nature Communications avec le titre «Apprendre en profondeur les sections efficaces de collision de l’univers peptidique à partir d’un million de valeurs expérimentales» par Florian Meier et al. (doi.org/10.1038/s41467-021-21352-8).
Figure 1. Mesure à grande échelle de la section efficace de collision de peptides (CCS) avec TIMS et PASEF. De « Apprendre en profondeur les sections efficaces de collision de l’univers peptidique à partir d’un million de valeurs expérimentales ». (a) Flux de travail de l’extraction de protéomes de cellules entières par digestion, fractionnement et séparation chromatographique de chaque fraction. Le spectromètre de masse TOF quadripolaire TIMS fonctionnait en mode PASEF. (b) Vue d’ensemble de l’ensemble de données CCS dans cette étude par organisme. (c) Fréquence des acides aminés peptidiques C-terminaux. (d) Fréquence des acides aminés N-terminaux peptidiques. (e) Distribution de 559 979 points de données uniques, y compris la séquence modifiée et l’état de charge, dans l’espace CCS par rapport à m / z, codés en couleur par état de charge. Les distributions de densité pour m / z et CCS sont projetées sur les axes supérieur et droit, respectivement. Les données source sont fournies sous forme de fichier de données source. Crédit d’image: Bruker Daltonics
L’article de Nature Communications décrit les valeurs CCS mesurées sur le timsTOF Pro comme une propriété essentiellement intrinsèque des ions peptides, qui peuvent être utilisées pour améliorer la confiance dans l’identification des peptides et des groupes protéiques dans la protéomique des fusils de chasse 4D. Étant donné que la protéomique basée sur la spectrométrie de masse repose sur une correspondance précise des spectres acquis avec une base de données de séquences protéiques, des valeurs CCS précises offrent l’avantage de réduire la liste des candidats. Ceci est essentiel pour la protéomique à haute sensibilité où de faibles niveaux de signaux peptidiques doivent être mesurés avec précision dans un mélange complexe, par exemple en protéomique plasmatique, peptidomique, immunopeptidomique ou métaprotéomique.
La publication résume un effort de recherche collaboratif dirigé par le professeur Matthias Mann, qui détient deux mandats à l’Institut Max Planck de biochimie à Martinsried, en Allemagne et au Centre de recherche sur les protéines de la Fondation Novo Nordisk à l’Université de Copenhague au Danemark, avec le groupe de Le professeur Fabian Theis, qui est également titulaire de deux mandats au Helmholtz Center Munich au Centre de recherche allemand sur la santé environnementale et au Département de mathématiques de la TU Munich, en Allemagne.
L’auteur principal, le Dr Florian Meier, maintenant professeur assistant en protéomique fonctionnelle à l’hôpital universitaire de Jena en Allemagne, a déclaré: «L’échelle et la précision des valeurs de CCS peptidiques dans nos données du timsTOF Pro étaient suffisantes pour former notre modèle d’apprentissage profond à prédire les valeurs CCS basées uniquement sur la séquence peptidique. Cette connexion entre les acides aminés contenus dans une séquence peptidique et son CCS mesuré a un potentiel énorme pour augmenter la confiance de l’identification des protéines. Étant donné que les valeurs CCS des peptides sont entièrement déterminées par leurs séquences linéaires d’acides aminés, elles devraient être prévisibles avec une grande précision et notre modèle d’apprentissage en profondeur a prédit avec précision les valeurs CCS, même pour des peptides non observés auparavant. Nous avons acquis des données à partir de digestions de protéomes entiers de cinq organismes, ce qui a permis de mesurer plus de deux millions de valeurs CCS, dont environ 500 000 peptides uniques, ce qui en fait de loin l’ensemble de données CCS le plus complet à ce jour.
Le code source est accessible au public afin que les développements ultérieurs puissent être accélérés pour les modèles d’entraînement et de prédiction de l’univers peptidique humain. Conceptuellement, notre modèle CCS pourrait rendre dia-PASEF® plus rapide et moins coûteux en réduisant l’effort de génération de bibliothèques. En outre, les valeurs CCS prévues devraient permettre l’utilisation de bibliothèques communautaires, telles que la bibliothèque Pan Human, un référentiel de plus de 10 000 protéines humaines, pour la protéomique ciblée. »
Matthias Mann, Professeur
Le professeur Fabian Theis a déclaré: «L’apprentissage en profondeur, en particulier les réseaux de neurones récurrents utilisés, ont besoin de beaucoup d’échantillons pour être prédictifs, j’ai donc été très heureux lorsque Matthias m’a approché et nous avons conjointement pu prédire et interpoler les propriétés biochimiques des peptides en se basant uniquement sur leur séquence. J’ai personnellement aimé le fait que nous pourrions ainsi imputer des valeurs CCS également pour de nombreux peptides jamais mesurés auparavant. «
Cet article présente l’énorme potentiel des valeurs CCS précises pour les méthodes TIMS-PASEF dans la 4D-ProteomicsTM non biaisée et profonde. La robustesse éprouvée, le débit plus élevé et la sensibilité ultra-élevée de la plate-forme timsTOF conviennent parfaitement à la recherche translationnelle. Les valeurs CCS peptidiques à grande échelle fournissent un avantage fondamental dans la confiance de l’identification et de la quantification des protéines dans la recherche sur les biomarqueurs dans les études de grande cohorte. En outre, les avantages des valeurs CCS pour améliorer la fiabilité de l’identification sont également applicables à d’autres flux de travail timsTOF multiomiques, tels que la métabolomique, la lipidomique et la glycomique. Ce sont des moments passionnants pour notre communauté d’utilisateurs timsTOF en pleine croissance. »
Dr Gary Kruppa, Vice-président Bruker, Protéomique
La source:
Référence du journal:
Meier, F., Köhler, ND, Brunner, AD. et coll. Apprendre en profondeur les sections efficaces de collision de l’univers peptidique à partir d’un million de valeurs expérimentales. Nat Commun 12, 1185 (2021). https://doi.org/10.1038/s41467-021-21352-8