Back to Search Start Over

Bayesian inference for biomarker discovery in proteomics: an analytic solution

Authors :
Patrick Ducoroy
Bruno Lacroix
Laurent Gerfault
Melita Hadzagic
Pascal Roy
Jean-Philippe Charrier
Pierre Grangeat
Audrey Giremus
Jean-François Giovannelli
Noura Dridi
Caroline Truntzer
Laboratoire de l'intégration, du matériau au système ( IMS )
Université Sciences et Technologies - Bordeaux 1-Institut Polytechnique de Bordeaux-Centre National de la Recherche Scientifique ( CNRS )
Plate-forme Protéomique CLIPP - Clinical and Innovation Proteomic Platform [Dijon] ( CLIPP )
Franche-Comté Électronique Mécanique, Thermique et Optique - Sciences et Technologies ( FEMTO-ST )
Université de Technologie de Belfort-Montbeliard ( UTBM ) -Ecole Nationale Supérieure de Mécanique et des Microtechniques ( ENSMM ) -Centre National de la Recherche Scientifique ( CNRS ) -Université de Franche-Comté ( UFC ) -Université de Technologie de Belfort-Montbeliard ( UTBM ) -Ecole Nationale Supérieure de Mécanique et des Microtechniques ( ENSMM ) -Centre National de la Recherche Scientifique ( CNRS ) -Université de Franche-Comté ( UFC ) -Institut de Chimie Moléculaire de l'Université de Bourgogne [Dijon] ( ICMUB )
Université de Bourgogne ( UB ) -Centre National de la Recherche Scientifique ( CNRS ) -Université de Bourgogne ( UB ) -Centre National de la Recherche Scientifique ( CNRS )
Recherche Technologique, bioMerieux SA
BIOMERIEUX
Laboratoire d'Electronique et des Technologies de l'Information ( CEA-LETI )
Commissariat à l'énergie atomique et aux énergies alternatives ( CEA ) -Université Grenoble Alpes [Saint Martin d'Hères]
Biomérieux Lyon
Laboratoire de Biométrie et Biologie Evolutive ( LBBE )
Université Claude Bernard Lyon 1 ( UCBL )
Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique ( Inria ) -Centre National de la Recherche Scientifique ( CNRS )
Laboratoire de l'intégration, du matériau au système (IMS)
Centre National de la Recherche Scientifique (CNRS)-Institut Polytechnique de Bordeaux-Université Sciences et Technologies - Bordeaux 1
Plate-forme Protéomique CLIPP - Clinical and Innovation Proteomic Platform [Dijon] (CLIPP)
Franche-Comté Électronique Mécanique, Thermique et Optique - Sciences et Technologies (UMR 6174) (FEMTO-ST)
Université de Technologie de Belfort-Montbeliard (UTBM)-Ecole Nationale Supérieure de Mécanique et des Microtechniques (ENSMM)-Université de Franche-Comté (UFC)
Université Bourgogne Franche-Comté [COMUE] (UBFC)-Université Bourgogne Franche-Comté [COMUE] (UBFC)-Centre National de la Recherche Scientifique (CNRS)-Université de Technologie de Belfort-Montbeliard (UTBM)-Ecole Nationale Supérieure de Mécanique et des Microtechniques (ENSMM)-Université de Franche-Comté (UFC)
Université Bourgogne Franche-Comté [COMUE] (UBFC)-Université Bourgogne Franche-Comté [COMUE] (UBFC)-Centre National de la Recherche Scientifique (CNRS)-Institut de Chimie Moléculaire de l'Université de Bourgogne [Dijon] (ICMUB)
Université de Bourgogne (UB)-Institut de Chimie du CNRS (INC)-Centre National de la Recherche Scientifique (CNRS)-Université de Bourgogne (UB)-Institut de Chimie du CNRS (INC)-Centre National de la Recherche Scientifique (CNRS)
Commissariat à l'énergie atomique et aux énergies alternatives - Laboratoire d'Electronique et de Technologie de l'Information (CEA-LETI)
Direction de Recherche Technologique (CEA) (DRT (CEA))
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)
Biostatistiques santé
Département biostatistiques et modélisation pour la santé et l'environnement [LBBE]
Laboratoire de Biométrie et Biologie Evolutive - UMR 5558 (LBBE)
Université Claude Bernard Lyon 1 (UCBL)
Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL)
Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire de Biométrie et Biologie Evolutive - UMR 5558 (LBBE)
Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)
Université Sciences et Technologies - Bordeaux 1 (UB)-Institut Polytechnique de Bordeaux-Centre National de la Recherche Scientifique (CNRS)
Université de Technologie de Belfort-Montbeliard (UTBM)-Ecole Nationale Supérieure de Mécanique et des Microtechniques (ENSMM)-Centre National de la Recherche Scientifique (CNRS)-Université de Franche-Comté (UFC)
Université Bourgogne Franche-Comté [COMUE] (UBFC)-Université Bourgogne Franche-Comté [COMUE] (UBFC)-Université de Technologie de Belfort-Montbeliard (UTBM)-Ecole Nationale Supérieure de Mécanique et des Microtechniques (ENSMM)-Centre National de la Recherche Scientifique (CNRS)-Université de Franche-Comté (UFC)
Université Bourgogne Franche-Comté [COMUE] (UBFC)-Université Bourgogne Franche-Comté [COMUE] (UBFC)-Institut de Chimie Moléculaire de l'Université de Bourgogne [Dijon] (ICMUB)
Service de Biostatistiques [Lyon]
Hospices Civils de Lyon (HCL)
Université Sciences et Technologies - Bordeaux 1-Institut Polytechnique de Bordeaux-Centre National de la Recherche Scientifique (CNRS)
Source :
EURASIP Journal on Bioinformatics and Systems Biology, EURASIP Journal on Bioinformatics and Systems Biology, SpringerOpen, 2017, 2017, pp.9. 〈10.1186/s13637-017-0062-4〉, EURASIP Journal on Bioinformatics and Systems Biology, SpringerOpen, 2017, 2017, pp.9. ⟨10.1186/s13637-017-0062-4⟩, EURASIP Journal on Bioinformatics and Systems Biology, 2017, 2017, pp.9. ⟨10.1186/s13637-017-0062-4⟩
Publication Year :
2017
Publisher :
HAL CCSD, 2017.

Abstract

International audience; This paper addresses the question of biomarker discovery in proteomics. Given clinical data regarding a list of proteins for a set of individuals, the tackled problem is to extract a short subset of proteins the concentrations of which are an indicator of the biological status (healthy or pathological). In this paper, it is formulated as a specific instance of variable selection. The originality is that the proteins are not investigated one after the other but the best partition between discriminant and non-discriminant proteins is directly sought. In this way, correlations between the proteins are intrinsically taken into account in the decision. The developed strategy is derived in a Bayesian setting, and the decision is optimal in the sense that it minimizes a global mean error. It is finally based on the posterior probabilities of the partitions. The main difficulty is to calculate these probabilities since they are based on the so-called evidence that require marginalization of all the unknown model parameters. Two models are presented that relate the status to the protein concentrations, depending whether the latter are biomarkers or not. The first model accounts for biological variabilities by assuming that the concentrations are Gaussian distributed with a mean and a covariance matrix that depend on the status only for the biomarkers. The second one is an extension that also takes into account the technical variabilities that may significantly impact the observed concentrations. The main contributions of the paper are: (1) a new Bayesian formulation of the biomarker selection problem, (2) the closed-form expression of the posterior probabilities in the noiseless case, and (3) a suitable approximated solution in the noisy case. The methods are numerically assessed and compared to the state-of-the-art methods (t test, LASSO, Battacharyya distance, FOHSIC) on synthetic and real data from proteins quantified in human serum by mass spectrometry in selected reaction monitoring mode.

Details

Language :
English
ISSN :
16874145 and 16874153
Database :
OpenAIRE
Journal :
EURASIP Journal on Bioinformatics and Systems Biology, EURASIP Journal on Bioinformatics and Systems Biology, SpringerOpen, 2017, 2017, pp.9. 〈10.1186/s13637-017-0062-4〉, EURASIP Journal on Bioinformatics and Systems Biology, SpringerOpen, 2017, 2017, pp.9. ⟨10.1186/s13637-017-0062-4⟩, EURASIP Journal on Bioinformatics and Systems Biology, 2017, 2017, pp.9. ⟨10.1186/s13637-017-0062-4⟩
Accession number :
edsair.doi.dedup.....ec59ab4494b3edc06fe14c352b287030
Full Text :
https://doi.org/10.1186/s13637-017-0062-4〉