1. PeakForest: a multi-platform digital infrastructure for interoperable metabolite spectral data and metadata management
- Author
-
Nils Paulhe, Cécile Canlet, Annelaure Damont, Lindsay Peyriga, Stéphanie Durand, Catherine Deborde, Sandra Alves, Stephane Bernillon, Thierry Berton, Raphael Bir, Alyssa Bouville, Edern Cahoreau, Delphine Centeno, Robin Costantino, Laurent Debrauwer, Alexis Delabrière, Christophe Duperier, Sylvain Emery, Amelie Flandin, Ulli Hohenester, Daniel Jacob, Charlotte Joly, Cyril Jousse, Marie Lagree, Nadia Lamari, Marie Lefebvre, Claire Lopez-Piffet, Bernard Lyan, Mickael Maucourt, Carole Migne, Marie-Francoise Olivier, Estelle Rathahao-Paris, Pierre Petriacq, Julie Pinelli, Léa Roch, Pierrick Roger, Simon Roques, Jean-Claude Tabet, Marie Tremblay-Franco, Mounir Traïkia, Anna Warnet, Vanessa Zhendre, Dominique Rolin, Fabien Jourdan, Etienne Thévenot, Annick Moing, Emilien Jamin, François Fenaille, Christophe Junot, Estelle Pujos-Guillot, Franck Giacomoni, Unité de Nutrition Humaine (UNH), Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Université Clermont Auvergne (UCA), Metatoul AXIOM (E20 ), MetaboHUB-MetaToul, MetaboHUB-Génopole Toulouse Midi-Pyrénées [Auzeville] (GENOTOUL), Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université de Toulouse (UT)-Ecole Nationale Vétérinaire de Toulouse (ENVT), Institut National Polytechnique (Toulouse) (Toulouse INP), Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-MetaboHUB-Génopole Toulouse Midi-Pyrénées [Auzeville] (GENOTOUL), Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-ToxAlim (ToxAlim), Université de Toulouse (UT)-Ecole d'Ingénieurs de Purpan (INP - PURPAN), Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Ecole d'Ingénieurs de Purpan (INP - PURPAN), Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), ToxAlim (ToxAlim), Médicaments et Technologies pour la Santé (MTS), Université Paris-Saclay-Direction de Recherche Fondamentale (CEA) (DRF (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Plateforme Exploration du Métabolisme (PFEM), Institut National de la Recherche Agronomique (INRA)-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-MetaboHUB-Clermont, MetaboHUB-MetaboHUB, Biologie du fruit et pathologie (BFP), Université de Bordeaux (UB)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Plateforme Bordeaux Metabolome, Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-MetaboHUB-Bordeaux, MetaToul FluxoMet (TBI-MetaToul), Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Toulouse Biotechnology Institute (TBI), Institut National des Sciences Appliquées - Toulouse (INSA Toulouse), Institut National des Sciences Appliquées (INSA)-Université de Toulouse (UT)-Institut National des Sciences Appliquées (INSA)-Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut National des Sciences Appliquées - Toulouse (INSA Toulouse), Institut National des Sciences Appliquées (INSA)-Université de Toulouse (UT)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), The PeakForest project is supported by the French National Facility in Metabolomics & Fluxomics, MetaboHUB (11-INBS-0010), launched by the French Ministry of Research and Higher Education and the French ANR funding agency within the Programme 'Investissements d’Avenir', and ANR-11-INBS-0010,METABOHUB,Développement d'une infrastructure française distribuée pour la métabolomique dédiée à l'innovation(2011)
- Subjects
Metadata ,[INFO.INFO-DB]Computer Science [cs]/Databases [cs.DB] ,Endocrinology, Diabetes and Metabolism ,[SDV]Life Sciences [q-bio] ,Clinical Biochemistry ,Metabolite identification ,Spectral library ,Interoperability ,Biochemistry ,Mass Spectrometry ,Curation ,Database ,Metabolome ,[CHIM]Chemical Sciences ,Metabolomics ,[INFO.INFO-BI]Computer Science [cs]/Bioinformatics [q-bio.QM] ,Data Curation ,FAIR - Abstract
Introduction Accuracy of feature annotation and metabolite identification in biological samples is a key element in metabolomics research. However, the annotation process is often hampered by the lack of spectral reference data in experimental conditions, as well as logistical difficulties in the spectral data management and exchange of annotations between laboratories. Objectives To design an open-source infrastructure allowing hosting both nuclear magnetic resonance (NMR) and mass spectra (MS), with an ergonomic Web interface and Web services to support metabolite annotation and laboratory data management. Methods We developed the PeakForest infrastructure, an open-source Java tool with automatic programming interfaces that can be deployed locally to organize spectral data for metabolome annotation in laboratories. Standardized operating procedures and formats were included to ensure data quality and interoperability, in line with international recommendations and FAIR principles. Results PeakForest is able to capture and store experimental spectral MS and NMR metadata as well as collect and display signal annotations. This modular system provides a structured database with inbuilt tools to curate information, browse and reuse spectral information in data treatment. PeakForest offers data formalization and centralization at the laboratory level, facilitating shared spectral data across laboratories and integration into public databases. Conclusion PeakForest is a comprehensive resource which addresses a technical bottleneck, namely large-scale spectral data annotation and metabolite identification for metabolomics laboratories with multiple instruments. PeakForest databases can be used in conjunction with bespoke data analysis pipelines in the Galaxy environment, offering the opportunity to meet the evolving needs of metabolomics research. Developed and tested by the French metabolomics community, PeakForest is freely-available at https://github.com/peakforest.
- Published
- 2022
- Full Text
- View/download PDF