1. Multiblock data analysis with the RGCCA package
- Author
-
Girka, Fabien, Camenen, Etienne, Peltier, Caroline, Guillemot, Vincent, Le Brusquet, Laurent, Tenenhaus, Arthur, Laboratoire des signaux et systèmes (L2S), CentraleSupélec-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Institut du Cerveau = Paris Brain Institute (ICM), Assistance publique - Hôpitaux de Paris (AP-HP) (AP-HP)-Institut National de la Santé et de la Recherche Médicale (INSERM)-CHU Pitié-Salpêtrière [AP-HP], Assistance publique - Hôpitaux de Paris (AP-HP) (AP-HP)-Sorbonne Université (SU)-Sorbonne Université (SU)-Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS), Centre des Sciences du Goût et de l'Alimentation [Dijon] (CSGA), Université de Bourgogne (UB)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut Agro Dijon, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), Plateforme Chemosens [Dijon], Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Université de Bourgogne (UB)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut Agro Dijon, Hub Bioinformatique et Biostatistique - Bioinformatics and Biostatistics HUB, Institut Pasteur [Paris] (IP)-Université Paris Cité (UPCité), UDOPIA + the European Union’s Horizon 2020 research and innovation program + the AP-HP Foundation, within the framework of the AIRACLES Chair., Projet RGCCA, ANR-20-THIA-0013,UDOPIA,Programme Doctoral en Intelligence Artificielle de l'Université Paris-Saclay(2020), and European Project: 874583,H2020,H2020-EU.3.1.2.,ATHLETE(2020)
- Subjects
[MATH.MATH-PR]Mathematics [math]/Probability [math.PR] ,RGCCA ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,Multiblock component methods ,data integration - Abstract
International audience; Multiblock component methods aim to study the relationships between several sets of variables. Regularized Generalized Canonical Correlation Analysis (RGCCA) is a unified and flexible framework that gathers fifty years of multiblock component methods. RGCCA offers a unified implementation strategy for all these methods. This implementation is made available within the RGCCA package. In addition, the RGCCA package produces graphical outputs and statistics to assess the robustness/significance of the analysis. The usefulness of the RGCCA package is illustrated in this paper on two real datasets. The RGCCA package is freely available on the ComprehensiveR Archive Network (CRAN) http://www.r-project.org/ and GitHub https://github.com/rgcca-factory/RGCCA.
- Published
- 2023
- Full Text
- View/download PDF