Banques de données, bases de connaissance et dépôts de référence en Métabolomique

La page est créée Yves Lambert
 
CONTINUER À LIRE
Banques de données, bases de connaissance et dépôts de référence en Métabolomique
Banques de données, bases
de connaissance et dépôts de
référence en Métabolomique
        Franck Giacomoni – MetaboHUB – INRA.PFEM
 Session « Analyse et interprétation de données métabolomiques et
          protéomiques : points communs et spécificités »
               28 mars 2018 – Forum Labo – Lyon

                         SFEAP - RFMF
Banques de données, bases de connaissance et dépôts de référence en Métabolomique
Analyses des données en Métabolomique
                     Annotation
                                                         Interprétation

                                        Identification

         Extraction Data
                                   Analyses
                                  statistiques

             Méthode
            analytique
Banques de données, bases de connaissance et dépôts de référence en Métabolomique
L’identification, étape complexe…

                                     Diversités des familles chimiques de
                                                 Métabolites
        Diversité
     instrumentale
       1 molécule

Technique 01   Technique 02

                              Métabolites en
                                différentes
                              concentrations
Banques de données, bases de connaissance et dépôts de référence en Métabolomique
L’identification, étape complexe et longue…                                                                                                                 Expérimentation métabolomique

                                  70                                                                                                                                                                         8000

                                             7020 ions                                                                                                                                      60
                                                                                                                    Temps (jours)
                                                                                                                                                                                                             7000
                                  60
                                                                                                                    Nombre de variables

                                                                               5590 ions                                                                                                                     6000
                                  50

                                                                                                                                                                                                             5000
                                  40

                                                                                                                                                                                                                    Nombre de variables
                Nombre de jours

                                                                                                                                                              30                                             4000
                                                                                                     2960 ions

                                  30                                                                significatifs

                                                                                                                                                                                                             3000
                                                                                                                                 20

                                  20
                                                                                                                                                                                                             2000
                                                                                                     10
                                                                                                                                590 métabolites et

                                  10             5                         5                                                  fragments potentiels
                                                                                                                                                        20 métabolites                12 métabolites         1000

                                                                                                                                                            putatifs                    confirmés

                                   0                                                                                                                                                                         0

                                       Acquisition par LC-MS   Retraitement informatique   Analyse statistique du      Recherche d'adduits et    Confirmation d'identification   Interpretation biologique

                                                               (calcul de masses exacte,    protocole biologique     fragment, comparaison aux            par MS/MS

                                                                        filtrage)                                      bases de données pour

                                                                                                                            identification

                                                                                                          Etapes de l'étude
Banques de données, bases de connaissance et dépôts de référence en Métabolomique
Base de données, banques et librairies : définitions
 •   Une base de données : collection organisée d’information
 •   Une banque de données : représente la donnée seulement
 •   Une librairie : une façon de représenter cette information
 •   Une base de connaissance : agrégations et enrichissement de banques
 •   Un dépôt de référence : base de données, en accès libre, à usage général
     pour la recherche sur la métabolomique multiplateformes et inter-espèces.
Banques de données, bases de connaissance et dépôts de référence en Métabolomique
Des banques en Métabolomique…

 Banques de composés chimiques
        Librairies “faites maison”
            Librairies de spectres

  Bases de données de réseaux métaboliques

             Dépôts de références

                                     PSM V43 D169 Alfalfa fields in the desert, 1893
Banques de données, bases de connaissance et dépôts de référence en Métabolomique
Des banques en Métabolomique…
Banques de données, bases de connaissance et dépôts de référence en Métabolomique
Comment choisir votre banque ?
Banques de données, bases de connaissance et dépôts de référence en Métabolomique
F: FTMS + p ESI Full ms2 173.09@cid20.00 [50.00-800.00]
                                                                                                                                                     116.07041
                                                                                                         100
                                                                                                         95

                        Des empreintes métaboliques à annoter                                            90
                                                                                                         85                                 Exemple de la LCMS
                                                                                                         80
                                                                                                         75
                                                                                                         70
                                                                                                         65

                                                                                Relative Abundance
                                                                                                         60
                                                                                                         55
                                                                                                         50
                                                                                                         45
                                                                                                         40
                                                                                                         35
                                                                                                                                                                                            173.09190
                                                                                                         30                                                  127.08652
                                                                                                         25
                                                                                                         20
                                                                                                         15
                                                                                                         10                   80.49458                                           155.08136
                                                                                                                   70.06497
                                                                                                                                     86.06400                                          169.67426
                                                                                                           5    61.03990                                                                           184.86218
                                                                                                                                                102.71753                143.04167

                            Empreinte métabolique                                                          0
D:\439010\...\ara 0uM CdCl2 n1.1                12/07/02 15:50:20

                                                                                                                   60           80              100         120           140         160          180
 RT: 0,00 - 150,02
                                                                                                                           NL:                              m/z
   100

                                -    Masse moléculaire
                                                                                                                           1,63E7
                                                                                                                           Bas e Peak F: + c

                                                                                                                                      Spectre
                       90
                                                                                                                           ESI Full m s [
                                                                                                                           100,00-1000,00]

                                -    Précise
                       80                                                                                                  MS ara 0uM
                                                                                                                           CdCl2 n1.1

                                                                                                                                      -         M/Z
                       70
  Relative Abundance

                       60

                       50

                       40
                                                                                                                                      -         Intensité
                       30                                                                                                             -         À une temps de rétention donné
                       20

                       10

                        0
                            0       20    40      60               80     100            120                     140
                                                           Tim e (m in)
Banques de données, bases de connaissance et dépôts de référence en Métabolomique
Une molécule, c’est plusieurs ions…

                               Adduits
                             Ion pseudo
                             moléculaire
                             Fragments
Des banques… des stratégies d’annotations         Précision en masse

                                  Peak matching

             C10H15O4 (0.1 ppm)

                                      Banques de composés chimiques
Des banques… des stratégies d’annotations

   A public
                                   Chemical databank
repository of        Name
 information
   on small
  molecules
                VS   Chemical Entities of Biological Interest
                     Freely available dictionary of molecular entities focused on
   and their         ‘small’ chemical compounds.         Address
  biological
   activities
                                                       EMBL – EBI
                     Entries
                     41,000 entities fully annotated   www.ebi.ac.uk/chebi
       157,000,000
         entries
Des banques… des stratégies d’annotations

  Ressource de référence et publique
  Statut des données
     « Manually annotated by the ChEBI team »
     « Manually annotated by a third party »
     « Marked as deleted or obsolete »

  Systèmes d’Ontologies : structure moléculaire, rôles et informations sur
  les particules subatomiques.

  Recherche manuelle par masse et formule
  Web services
Des banques… des stratégies d’annotations

                                    REFERENCE

Spectral matching

         EXPERIMENTALE
Des banques… des stratégies d’annotations

                  EXPERIMENTALE

                    REFERENCE

                                Spectral matching
                                Score of 0.83630…
PeakForest – collection de métabolomes
                                                                                          PkForest

                                                  Fonctionnalités
                                                  Dépôts de métabolomes
                                                  SOP d’acquisition des données
                                                  Annotation de matrices biologiques
                                                  Curation de données, visualisation

     Indicateurs
     • 6 000 profiles métaboliques (MS & NMR) and 2 500 métabolites
     • Contributeurs : > 20 (4 nœuds FR MetaboHUB)

     Améliorations en cours
     •   Ajout de métabolomes complets d’organisme modèles
     •   Interopérabilité avec W4M, MetExplore & dépôts européens.                PI : Franck Giacomoni
     •   Devenir un dépôt de référence

                                      https://peakforest.org
Des banques… des stratégies... des résultats...
 Consolidons nos connaissances
                                                                                              ü Base de connaissances sur le
                                                                                                    « Food Metabolome »
                                                                                             ü Une base de données en ligne et
                                     Chemical                                                         en « open access »
                                    Structures
  In-house tool                                                Chemaxon Marvin
                                                                                                       ü Dédiée aux
Expert knowledge of
food phytochemicals    Predicted
                                                   Physico-    OpenBabel                       phytomicronutriments et leurs
                                                   chemical
 biotransformations   metabolites
                                                  properties                                             métabolites

                                                                Books: Phytochemical dictionary…
                       Known                       Dietary      Databases:
                      metabolites                  sources
+ Literature survey

                                     Spectral
                                       data                     + Literature survey
                                                                                                      PI : Claudine Manach

                                                 www.phytohub.eu
Des banques… des stratégies... des résultats... des connaissances...
Référencez SVP !

                                                            • W4M participe à l’effort de l’« open
                                                                science »
                                                            •   W4M fournit des DOI afin de
                                                                référencer les historiques de ses
                                                                utilisateurs (de la données brute aux
                                                                résultats statistiques et
                                                                d’annotation, les outils utilisés, leurs
                                                                paramètres et les workflows)
                                                            •   Utilisable dans les publications
         Guitton et al (2017). IJBC, doi:10.1016/j.biocel.2017.07.002

        http://workflow4metabolomics.org/referenced_W4M_histories
Des banques… des stratégies... des résultats... des connaissances...
Référencez SVP !
http://www.ebi.ac.uk/metabolights
Email: metabolights-help@ebi.ac.uk
MetaboLights - Open Source Database

           Sample Collection   Sample Preparation   Analytical Analysis   Data Interpretation

         • « Cross » espèces, « cross » techniques
         • Collection d’information la plus complète possible
         • « Open access », accessible via différents portails
Conclusions

• L’annotation est une étape critique et délicate – rôle premier des banques de données
• Echanges + efforts entre chimistes / biologistes / bioinformaticiens
• La constitution et le maintien de banques de données pour la métabolomique, de
    qualité est primordiale
•   Challenge(s) à relever :
     • Construire collections de métabolomes de références d’organismes modèles
     • Définition d’un composé chimique (nom(s), représentation 2D / 3D)
     • Développer les aspects « interopérabilité » avec les autres ressources de référence
       du domaine (Workflow4Metabolomics, MetExplore ;-) … )
Vous pouvez aussi lire