Back to Search Start Over

On the accuracy in high dimensional linear models under imperfect linkage disequilibrium

Authors :
Rabier , Charles-Elie
Grusea , Simona
Institut des Sciences de l'Evolution de Montpellier (UMR ISEM)
Centre de Coopération Internationale en Recherche Agronomique pour le Développement (CIRAD)-École pratique des hautes études (EPHE)-Université de Montpellier (UM)-Institut de recherche pour le développement [IRD] : UR226-Centre National de la Recherche Scientifique (CNRS)
Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier (LIRMM)
Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)
Institut de Mathématiques de Toulouse UMR5219 (IMT)
Centre National de la Recherche Scientifique (CNRS)-PRES Université de Toulouse-Université Toulouse III - Paul Sabatier (UPS)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse 1 Capitole (UT1)
Institut des Sciences de l'Evolution de Montpellier ( UMR ISEM )
Centre de Coopération Internationale en Recherche Agronomique pour le Développement ( CIRAD ) -Université de Montpellier ( UM ) -Institut de recherche pour le développement [IRD] : UR226-Centre National de la Recherche Scientifique ( CNRS )
Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier ( LIRMM )
Université de Montpellier ( UM ) -Centre National de la Recherche Scientifique ( CNRS )
Institut de Mathématiques de Toulouse UMR5219 ( IMT )
Université Toulouse 1 Capitole ( UT1 ) -Université Toulouse - Jean Jaurès ( UT2J ) -Université Toulouse III - Paul Sabatier ( UPS )
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-PRES Université de Toulouse-Institut National des Sciences Appliquées - Toulouse ( INSA Toulouse )
Institut National des Sciences Appliquées ( INSA ) -Institut National des Sciences Appliquées ( INSA ) -Centre National de la Recherche Scientifique ( CNRS )
Publication Year :
2019
Publisher :
HAL CCSD, 2019.

Abstract

Genomic selection (GS) consists in predicting breeding values of selection candidates, using a large number of genetic markers. An important question in GS is the determination of the number of markers required for a good prediction. Many studies show that it becomes useless to consider too many markers. In contrast, for some species, the number of markers remains too small to cover the huge genome size. Under such sparse genetic map, it is likely to observe some imperfect linkage disequilibrium: the alleles at a gene location and at a marker located nearby vary. In this context, we tackle here the problem of imperfect linkage disequilibrium in the Ridge regression framework. We present theoretical results regarding the accuracy criteria, i.e., the correlation between predicted value and true value. We show the influence of the projection of the causal regression function (i.e. at genes) on the space spanned by the columns of the design matrix (i.e. at markers). Asymptotic results, in a high dimensional framework, are given, and we prove that the convergence to an optimal accuracy depends on a few limiting factors. This study generalizes our recent results (Rabier et al. (2018)) obtained under perfect linkage disequi-librium. Last, illustrations on simulated and real data are proposed.

Details

Language :
English
Database :
OpenAIRE
Accession number :
edsair.dedup.wf.001..60738073364666f2a9f08474238c3365