Back to Search Start Over

Primal-Dual for Classification with Rejection (PD-CR): A novel method for classification and feature selection. An application in metabolomics studies

Authors :
Michel Barlaud
Caroline Bailleux
Valérie Rigau
Thierry Pourcher
Olivier Humbert
Fanny Burel-Vandenbos
David Chardin
Université Côte d'Azur - Faculté de Médecine (UCA Faculté Médecine)
Université Côte d'Azur (UCA)
Centre Régional de Lutte contre le cancer Georges-François Leclerc [Dijon] (UNICANCER/CRLCC-CGFL)
UNICANCER
Centre de Lutte contre le Cancer Antoine Lacassagne [Nice] (UNICANCER/CAL)
UNICANCER-Université Côte d'Azur (UCA)
Department of Pathology
Nice University Hospital
Institut des Neurosciences de Montpellier - Déficits sensoriels et moteurs (INM)
Institut National de la Santé et de la Recherche Médicale (INSERM)-Université de Montpellier (UM)
Transporteurs et Imagerie, Radiothérapie en Oncologie et Mécanismes biologiques des Altérations du Tissu Osseux (TIRO-MATOs - UMR E4320)
UMR E4320 (TIRO-MATOs)
Université Nice Sophia Antipolis (... - 2019) (UNS)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (... - 2019) (UNS)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Côte d'Azur (UCA)-Service Hospitalier Frédéric Joliot (SHFJ)
Direction de Recherche Fondamentale (CEA) (DRF (CEA))
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Direction de Recherche Fondamentale (CEA) (DRF (CEA))
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay
Laboratoire d'Informatique, Signaux, et Systèmes de Sophia-Antipolis (I3S) / Equipe IMAGES-CREATIVE
Signal, Images et Systèmes (Laboratoire I3S - SIS)
Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (... - 2019) (UNS)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)
Service Hospitalier Frédéric Joliot (SHFJ)
Université Paris-Saclay-Direction de Recherche Fondamentale (CEA) (DRF (CEA))
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-UMR E4320 (TIRO-MATOs)
Université Nice Sophia Antipolis (1965 - 2019) (UNS)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (1965 - 2019) (UNS)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Côte d'Azur (UCA)
Institut de Biologie Valrose (IBV)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)
Centre Hospitalier Régional Universitaire [Montpellier] (CHRU Montpellier)
Institut des Neurosciences de Montpellier (INM)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (1965 - 2019) (UNS)
ANR-19-P3IA-0002,3IA@cote d'azur,3IA Côte d'Azur(2019)
CHU Dijon
Centre Hospitalier Universitaire de Dijon - Hôpital François Mitterrand (CHU Dijon)
Université Côte d’Azur, CNRS, I3S
Barlaud, Michel
Source :
BMC Bioinformatics, BMC Bioinformatics, BioMed Central, In press, BMC Bioinformatics, 2021, 22 (1), ⟨10.1186/s12859-021-04478-w⟩, BMC Bioinformatics, BioMed Central, 2021, 22 (1), ⟨10.1186/s12859-021-04478-w⟩, BMC Bioinformatics, 2021, 22 (1), pp.594. ⟨10.1186/s12859-021-04478-w⟩, BMC Bioinformatics, Vol 22, Iss 1, Pp 1-17 (2021), BMC Bioinformatics, BioMed Central, In press, ⟨10.1186/s12859-021-04478-w⟩
Publication Year :
2021
Publisher :
HAL CCSD, 2021.

Abstract

Background: Supervised classification methods have been used for many years for feature selection in metabolomics and other omics studies. We developed a novel primal-dual based classification method (PD-CR) that can perform classification with rejection and feature selection on high dimensional datasets. PD-CR projects data onto a low dimension space and performs classification by minimizing an appropriate quadratic cost. It simultaneously optimizes the selected features and the prediction accuracy with a new tailored, constrained primal-dual method. The primal-dual framework is general enough to encompass various robust losses and to allow for convergence analysis. Here, we compared PD-CR to two commonly used methods : Partial Least Squares Discriminant Analysis (PLS-DA) and Random Forests. We analyzed two metabolomics datasets: one urinary metabolomics dataset concerning lung cancer patients and healthy controls; and a metabolomics dataset obtained from frozen glial tumor samples with mutated isocitrate dehydrogenase (IDH) or wild-type IDH. Results: PD-CR was more accurate than PLS-DA and Random Forests for classification using the 2 metabolomics datasets. It also selected biologically relevant metabolites. PD-CR has the advantage of providing a confidence score for each prediction, which can be used to perform classification with rejection. This substantially reduces the False Discovery Rate. Conclusion: The confidence score provided with PD-CR adds considerable value to the prediction as it includes a metric that is implicitly used by every physician when they make a medical decision: the probability to make the wrong choice. So far, one of the main obstacles to the use of machine learning in medicine resides in the fact that it is harder to trust the decision of a machine learning method than that of a physician when it comes to health issues. We believe that providing a confidence score associated to the decision would make these new tools more convincing if used in routine clinical practice.

Details

Language :
English
ISSN :
14712105
Database :
OpenAIRE
Journal :
BMC Bioinformatics, BMC Bioinformatics, BioMed Central, In press, BMC Bioinformatics, 2021, 22 (1), ⟨10.1186/s12859-021-04478-w⟩, BMC Bioinformatics, BioMed Central, 2021, 22 (1), ⟨10.1186/s12859-021-04478-w⟩, BMC Bioinformatics, 2021, 22 (1), pp.594. ⟨10.1186/s12859-021-04478-w⟩, BMC Bioinformatics, Vol 22, Iss 1, Pp 1-17 (2021), BMC Bioinformatics, BioMed Central, In press, ⟨10.1186/s12859-021-04478-w⟩
Accession number :
edsair.doi.dedup.....f013bd75951e1907027edf9c9a9e1d61