Wang, Xiaoqiang, Génétique Animale (GARen), Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Ecole Nationale Supérieure Agronomique de Rennes, AGROCAMPUS OUEST, and Pascale Le Roy
Identifying the causal polymorphism of a QTL remains a long and difficult step in most species of domestic animals. Under this framework, this work focuses on the integration of high throughput information on the expression of genes in a tissue. The traditional approach consists in detecting QTL on gene expression data (eQTL detection) by carrying out, gene by gene, the interval mapping methods. However, it appears that there is a bias on the estimated position of QTL. That leads, based on these high-dimensional data, to a high number of eQTL abnormally detected at the positions of the markers. The first part of this work is dedicated to the characterization of this bais in order to propose some ways to better control it. The parameters affecting the bias are discussed and an algorithm to improve the accuracy of the estimated position of the QTL is proposed. In the second part, the test of the co localization between eQTL and QTL is discussed. The aim is to reduce the list of eQTL declared "co localizing" with a QTL so that one could pass an individual study for these genes. In this framework, the conditions to guarantee the efficacy for the regression methods existing in the literature are sought. Then, some methods allowing to improve these conditions are proposed. Finally, perspectives of this work, we propose some tracks by the use of structural equation models to construct a network linking QTL, eQTL and traits.; La recherche du polymorphisme causal d’un QTL est une étape encore longue et difficile dans la plupart des espèces d’animaux domestiques. Dans ce cadre, ce travail porte sur l’intégration d’informations à haut débit sur l’expression des gènes dans un tissu. La démarche traditionnelle consiste à détecter des QTL sur ces données d’expression de gènes (détection de eQTL) en mettant en oeuvre, gène par gène, des méthodes de cartographie d’intervalle. Hors, il apparaît qu’il existe un biais sur la position estimée des QTL, biais aboutissant sur ces données de grande dimension à un nombre anormalement élevé de eQTL détectés sur les positions des marqueurs. La première partie de ce travail vise à caractériser ce biais afin de proposer des itinéraires pour mieux le maîtriser. Les paramètres affectant le biais sont étudiés, puis un algorithme pour améliorer l’estimation de la position du QTL est proposé. Dans une seconde partie, le test de la co localisation entre eQTL et QTL est abordé. L’objectif est de réduire la liste des eQTL déclarés « colocalisant » avec un QTL afin de permettre le passage à une étude individuelle de ces gènes. Dans ce contexte, les conditions favorables pour assurer l’efficacité des méthodes de régression existant dans la littérature sont recherchées. Des méthodes permettant de lever ces éventuelles conditions sont ensuite proposées. Enfin, en perspectives de ce travail, nous proposons des pistes de recherche pour l’utilisation des modèles d’équations structurelles (Structural Equation Modeling) pour finaliser la construction d’un réseau unissant QTL, eQTL et caractères.