Banques de données, bases de connaissance et dépôts de référence en Métabolomique
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Banques de données, bases de connaissance et dépôts de référence en Métabolomique Franck Giacomoni – MetaboHUB – INRA.PFEM Session « Analyse et interprétation de données métabolomiques et protéomiques : points communs et spécificités » 28 mars 2018 – Forum Labo – Lyon SFEAP - RFMF
Analyses des données en Métabolomique Annotation Interprétation Identification Extraction Data Analyses statistiques Méthode analytique
L’identification, étape complexe… Diversités des familles chimiques de Métabolites Diversité instrumentale 1 molécule Technique 01 Technique 02 Métabolites en différentes concentrations
L’identification, étape complexe et longue… Expérimentation métabolomique 70 8000 7020 ions 60 Temps (jours) 7000 60 Nombre de variables 5590 ions 6000 50 5000 40 Nombre de variables Nombre de jours 30 4000 2960 ions 30 significatifs 3000 20 20 2000 10 590 métabolites et 10 5 5 fragments potentiels 20 métabolites 12 métabolites 1000 putatifs confirmés 0 0 Acquisition par LC-MS Retraitement informatique Analyse statistique du Recherche d'adduits et Confirmation d'identification Interpretation biologique (calcul de masses exacte, protocole biologique fragment, comparaison aux par MS/MS filtrage) bases de données pour identification Etapes de l'étude
Base de données, banques et librairies : définitions • Une base de données : collection organisée d’information • Une banque de données : représente la donnée seulement • Une librairie : une façon de représenter cette information • Une base de connaissance : agrégations et enrichissement de banques • Un dépôt de référence : base de données, en accès libre, à usage général pour la recherche sur la métabolomique multiplateformes et inter-espèces.
Des banques en Métabolomique… Banques de composés chimiques Librairies “faites maison” Librairies de spectres Bases de données de réseaux métaboliques Dépôts de références PSM V43 D169 Alfalfa fields in the desert, 1893
F: FTMS + p ESI Full ms2 173.09@cid20.00 [50.00-800.00] 116.07041 100 95 Des empreintes métaboliques à annoter 90 85 Exemple de la LCMS 80 75 70 65 Relative Abundance 60 55 50 45 40 35 173.09190 30 127.08652 25 20 15 10 80.49458 155.08136 70.06497 86.06400 169.67426 5 61.03990 184.86218 102.71753 143.04167 Empreinte métabolique 0 D:\439010\...\ara 0uM CdCl2 n1.1 12/07/02 15:50:20 60 80 100 120 140 160 180 RT: 0,00 - 150,02 NL: m/z 100 - Masse moléculaire 1,63E7 Bas e Peak F: + c Spectre 90 ESI Full m s [ 100,00-1000,00] - Précise 80 MS ara 0uM CdCl2 n1.1 - M/Z 70 Relative Abundance 60 50 40 - Intensité 30 - À une temps de rétention donné 20 10 0 0 20 40 60 80 100 120 140 Tim e (m in)
Des banques… des stratégies d’annotations Précision en masse Peak matching C10H15O4 (0.1 ppm) Banques de composés chimiques
Des banques… des stratégies d’annotations A public Chemical databank repository of Name information on small molecules VS Chemical Entities of Biological Interest Freely available dictionary of molecular entities focused on and their ‘small’ chemical compounds. Address biological activities EMBL – EBI Entries 41,000 entities fully annotated www.ebi.ac.uk/chebi 157,000,000 entries
Des banques… des stratégies d’annotations Ressource de référence et publique Statut des données « Manually annotated by the ChEBI team » « Manually annotated by a third party » « Marked as deleted or obsolete » Systèmes d’Ontologies : structure moléculaire, rôles et informations sur les particules subatomiques. Recherche manuelle par masse et formule Web services
Des banques… des stratégies d’annotations REFERENCE Spectral matching EXPERIMENTALE
Des banques… des stratégies d’annotations EXPERIMENTALE REFERENCE Spectral matching Score of 0.83630…
PeakForest – collection de métabolomes PkForest Fonctionnalités Dépôts de métabolomes SOP d’acquisition des données Annotation de matrices biologiques Curation de données, visualisation Indicateurs • 6 000 profiles métaboliques (MS & NMR) and 2 500 métabolites • Contributeurs : > 20 (4 nœuds FR MetaboHUB) Améliorations en cours • Ajout de métabolomes complets d’organisme modèles • Interopérabilité avec W4M, MetExplore & dépôts européens. PI : Franck Giacomoni • Devenir un dépôt de référence https://peakforest.org
Des banques… des stratégies... des résultats... Consolidons nos connaissances ü Base de connaissances sur le « Food Metabolome » ü Une base de données en ligne et Chemical en « open access » Structures In-house tool Chemaxon Marvin ü Dédiée aux Expert knowledge of food phytochemicals Predicted Physico- OpenBabel phytomicronutriments et leurs chemical biotransformations metabolites properties métabolites Books: Phytochemical dictionary… Known Dietary Databases: metabolites sources + Literature survey Spectral data + Literature survey PI : Claudine Manach www.phytohub.eu
Des banques… des stratégies... des résultats... des connaissances... Référencez SVP ! • W4M participe à l’effort de l’« open science » • W4M fournit des DOI afin de référencer les historiques de ses utilisateurs (de la données brute aux résultats statistiques et d’annotation, les outils utilisés, leurs paramètres et les workflows) • Utilisable dans les publications Guitton et al (2017). IJBC, doi:10.1016/j.biocel.2017.07.002 http://workflow4metabolomics.org/referenced_W4M_histories
Des banques… des stratégies... des résultats... des connaissances... Référencez SVP !
http://www.ebi.ac.uk/metabolights Email: metabolights-help@ebi.ac.uk
MetaboLights - Open Source Database Sample Collection Sample Preparation Analytical Analysis Data Interpretation • « Cross » espèces, « cross » techniques • Collection d’information la plus complète possible • « Open access », accessible via différents portails
Conclusions • L’annotation est une étape critique et délicate – rôle premier des banques de données • Echanges + efforts entre chimistes / biologistes / bioinformaticiens • La constitution et le maintien de banques de données pour la métabolomique, de qualité est primordiale • Challenge(s) à relever : • Construire collections de métabolomes de références d’organismes modèles • Définition d’un composé chimique (nom(s), représentation 2D / 3D) • Développer les aspects « interopérabilité » avec les autres ressources de référence du domaine (Workflow4Metabolomics, MetExplore ;-) … )
Vous pouvez aussi lire