49 results on '"déséquilibre de liaison"'
Search Results
2. Hunting for causal variants in microbial genomes
- Author
-
Chen, Peter and Shapiro, Jesse
- Subjects
Homoplasy counting ,Microbial GWAS ,Linkage disequilibrium ,Allele counting ,Genetic architecture ,Étude d’association génomique microbienne ,Comptage d'allèles ,Comptage d'homoplasie ,Déséquilibre de liaison ,Architecture génétique - Abstract
L'un des objectifs centraux de la biologie est de comprendre comment l'ADN, la séquence primaire, donne lieu à des traits observables. À cette fin, nous examinons ici des méthodes pour identifier les composants génétiques qui influencent les traits microbiens. Par « identifier », nous entendons l'élucidation à la fois l'état allélique et de la position physique de chaque variante causale d'un phénotype d'intérêt à la résolution des nucléotides de paires de bases. Nous nous sommes concentrés sur les études d'association génomique (genome-wide association studies; GWAS) en tant qu'approche générale d’étudier l'architecture génétique des traits. L'objectif global de cette thèse était d'examiner de manière critique les méthodologies GWAS et de les considérer en pratique dans des populations microbiennes fortement clonales et non- clonales (i.e. avec recombinaison fréquent). Le domaine de la GWAS microbienne est relativement nouveau par rapport aux quinze dernières années de la GWAS humaine, et en tant que tel, nous avons commencé par un examen de l'état de la GWAS microbienne. Nous avons posé deux questions principales : 1) Les méthodes GWAS humaines fonctionnent-elles facilement et sans modification pour les populations microbiennes ? 2) Et sinon, quels sont les problèmes méthodologiques centraux et les modifications nécessaires pour la GWAS microbienne? À partir de ces résultats, nous avons ensuite détaillé le déséquilibre de liaison (linkage disequilibrium; LD) comme principal obstacle dans la GWAS microbien, et nous avons présenté une nouvelle méthode, POUTINE, pour relever ce défi en exploitant les mutations homoplasiques pour briser implicitement la structure LD. Le reste de la thèse présente à la fois les méthodes traditionnelles GWAS (comptage des allèles) et POUTINE (comptage d’homoplasies) appliquées à une population hautement recombinogène de génomes de vibrions marins. Malgré une taille d'échantillon modeste, nous donnons un premier aperçu de l'architecture génétique de la résistance aux bactériophages dans une population naturelle, tout en montrant que les récepteurs des bactériophages jouent un rôle primordial. Ce résultat est en pleine cohérence avec des expériences en laboratoire de coévolution phage-bactérie. Il est important de noter que cette architecture met en évidence à quel point la sélection positive peut sculpter certains traits microbiens différemment de nombreux traits complexes humains, qui sont généralement soumis à une faible sélection purificatrice. Plus précisément, nous avons identifié des mutations à effet important à haute fréquence qui sont rarement observées dans les phénotypes complexes humains où de nombreuses mutations à faible effet contribuent à l'héritabilité. La thèse se termine par des perspectives sur les voies à suivre pour la GWAS microbienne., One of the central goals of biology is to understand how DNA, the primary sequence, gives rise to observable traits. To this aim, we herein examine methods to identify the genetic components that influence microbial traits. By "identify" we mean the elucidation of both the allelic state and physical position of each causal variant of a phenotype of interest down to the base-pair nucleotide resolution. Our focus has been on genome-wide association studies (GWAS) as a general approach to dissecting the genetic architecture of traits. The overarching aim of this thesis was to critically examine GWAS methodologies and to consider them in practice in both strongly clonal and highly recombining microbial populations. The field of microbial GWAS is relatively new compared to the over fifteen years of human GWAS, and as such, we began this work with an examination of the state of microbial GWAS. We asked and attempted to answer two main questions: 1) Do human GWAS methods readily work without modification for microbial populations? 2) And if not, what are the central methodological problems and changes that are required for a successful microbial GWAS? Building from these findings, we then detailed linkage disequilibrium (LD) as the primary obstacle in microbial GWAS, and we presented a new method, POUTINE, to address this challenge by harnessing homoplasic mutations to implicitly break LD structure. The remainder of the thesis showcases both traditional GWAS methods (allele counting) and POUTINE applied to a highly recombining population of marine vibrio genomes. Despite a small sample size, we provide a first glimpse into the genetic architecture of bacteriophage resistance in a natural population and show that bacteriophage receptors play a primary role consistent with experimental populations of phage-bacteria coevolution. Importantly, this architecture highlights how strong positive selection can sculpt some microbial traits differently than many human complex traits, which are generally under weak purifying selection. Specifically, we identified common frequency, large-effect mutations that are rarely observed in human complex phenotypes where many low-effect mutations are thought to contribute to the bulk of heritability. The thesis concludes with perspectives on ways forward for microbial GWAS.
- Published
- 2022
3. Méthodes d’inférence démographique récente utilisant les polymorphismes et leur liaison génétique
- Author
-
Kerdoncuff, Elise and STAR, ABES
- Subjects
Population genetics ,Coalescence theory ,Inference methods ,Déséquilibre de liaison ,Génétique des populations ,Démographie ,Génétique de la conservation ,Théorie de la coalescence ,[SDV.GEN.GPO] Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,Conservation genetics ,Méthodes d’inférences ,Demography ,Inkage disequilibrium ,[SDV.BID] Life Sciences [q-bio]/Biodiversity - Abstract
The impact of human industrial activities leads to a significant biodiversity loss. However, 94% of described species do not have a conservation status, which is essential to implement conservation policies. Indeed, methods used to assign these statuses are generally qualitative and can not be applied properly to all species. We have proposed a quantitative methodology using multiple genome alignments sampled in a given population to infer its recent demographic history, in particular detecting sudden changes in population size. We used both the information from polymorphisms, summarized by the site frequency spectrum, and the information from their genetic linkage, summarized by the length distribution of non-recombinant DNA segments, or segments compatible with a single genealogy. We have shown that these two sources of information are not affected in the same way by the different parameters of the demographic scenario considered. It is therefore possible to have a more accurate inference by combining these two sources of information, both to select a scenario and to infer its parameters., L'impact des activités industrielles humaines conduit à une érosion importante de la biodiversité. Cependant, 94% des espèces décrites ne possèdent pas de statut de conservation, pourtant indispensable à la mise en place de politiques de conservation. En effet, les méthodes utilisées pour attribuer ces statuts sont généralement qualitatives et ne peuvent s’appliquer de manière rigoureuse à l’ensemble des espèces. Nous avons proposé une méthodologie quantitative utilisant les alignements multiples de génomes échantillonnés dans une population donnée pour en inférer l’histoire démographique récente, détectant notamment les changements soudains de taille de population. Nous avons utilisé à la fois l'information issue des polymorphismes, résumée par leur spectre de fréquence, et celle issue de leur liaison génétique, résumée par la distribution des longueurs de segments d’ADN non recombinés, ou compatibles avec une seule généalogie. Nous avons démontré que ces deux sources d’informations n’étaient pas affectées de la même manière par les différents paramètres du scénario démographique considéré. Il est donc possible de gagner en précision en combinant ces deux informations, aussi bien pour sélectionner un scénario que pour en inférer les paramètres. Nous nous sommes également intéressés à un modèle d’évolution moléculaire plus général que le coalescent standard autorisant les multifurcations dans les généalogies et avons démontré que l’utilisation de ce modèle permettait d’expliquer une plus grande partie de la diversité observée.
- Published
- 2021
4. A possible breakage of linkage disequilibrium between mitochondrial and chloroplast genomes during Emmer and Dinkel wheat evolution.
- Author
-
Tsujimura, Mai, Mori, Naoki, Yamagishi, Hiroshi, Terachi, Toru, and Bonen, L.
- Subjects
- *
MITOCHONDRIAL DNA , *AEGILOPS , *LINKAGE (Genetics) , *EMMER wheat , *MICROSATELLITE repeats , *CHLOROPLASTS - Abstract
In wheat ( Triticum) and Aegilops, chloroplast and mitochondrial genomes have been studied for over three decades to clarify the phylogenetic relationships among species, and most of the maternal lineages of polyploid species have been clarified. Mitochondrial genomes of Emmer (tetraploid with nuclear genome AABB) and Dinkel (hexaploid with AABBDD) wheat are classified into two different types, VIIa and VIIb, by the presence-absence of the third largest HindIII fragment (named H3) in the mitochondrial DNA. Although the mitochondrial genome in the genera often provides useful information to clarify the phylogenetic relationship among closely related species, the phylogenetic significance of this dimorphism has yet not been clarified. In this study, to facilitate analysis using a large number of accessions, a sequence characterized amplified region (SCAR) marker that distinguishes the type VIIb mitochondrial genome from type VIIa was first developed. Mitochondrial genome type was determined for each of 30 accessions of wild and cultivated Emmer wheat and 25 accessions of Dinkel wheat. The mitochondrial genome type for each accession was compared with the plastogroup that had been determined using chloroplast microsatellite markers. Unexpectedly, the distribution of mitochondrial genome type was not in accordance with that of the plastogroups, suggesting occasional paternal leakage of either the mitochondrial or chloroplast genome during speciation and differentiation of Emmer and Dinkel wheat. An alternative possibility that substoichiometric shifting is involved in the observed dimorphism of the mitochondrial genome is also discussed. [ABSTRACT FROM AUTHOR]
- Published
- 2013
- Full Text
- View/download PDF
5. Genetic diversity of maize kernel starch-synthesis genes with SNAPs.
- Author
-
Ji-Hyun Shin, Soon-Jae Kwon, Ju Kyong Lee, Hwang-Kee Min, and Nam-Soo Kim
- Subjects
- *
CORN breeding , *STARCH , *GENETIC polymorphisms , *GENES , *POPULATION genetics - Abstract
Measuring genetic diversity in populations of a crop species is very important for understanding the genetic structure of and subsequently improving the crop species by genetic manipulation. Single-nucleotide amplified polymorphisms (SNAPs) among and within maize populations of waxy, dent, and sweet corns at 25 single-nucleotide polymorphism (SNP) sites in 6 kernel starch-synthesis genes (sh2, bt2, su1, ae1, wx1, and sh1) were determined. Because of the intensive selection of some favorable alleles in starch-synthesis genes during the breeding process, and the resultant strong linkage disequilibrium (LD), the number of haplotypes in each population was far less than expected. Subsequent phenetic clustering analysis with the SNAPs indicated that the dent, waxy, and sweet corns formed distinct subclusters, except in a few incidences. LD was surveyed among SNAPs of intragenic, intergenic, and intrachromosomal SNPs in whole and subpopulations, which revealed that some SNAPs showed high LD with many other SNAPs, but some SNAPs showed low or no significant LD with others, depending on the subpopulation, indicating that these starch genes have undergone different selection in each subpopulation during the breeding process. Because the starch synthesis genes used in this study are important in maize breeding, the genetic diversity, LD, and accessions having rare SNAP alleles might be valuable in maize improvement programs. [ABSTRACT FROM AUTHOR]
- Published
- 2006
- Full Text
- View/download PDF
6. Étude du déséquilibre de liaison dans des lignées de poules de types génétiques 'ponte' et 'chair'
- Author
-
Hérault, Frédéric, Varenne, Amandine, Burlot, Thierry, Recoquillay, Julien, Macé, Camille, Fagnoul, Frédéric, Picard Druet, David, Herry, Florian, Allais, Sophie, Le Roy, Pascale, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), Novogen, Hubbard SAS, Partenaires INRAE, NOVOGEN, Groupe Grimaud, Hubbard, and AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA)
- Subjects
volaille ,[SDV.GEN]Life Sciences [q-bio]/Genetics ,[SDV.GEN.GA]Life Sciences [q-bio]/Genetics/Animal genetics ,cartographie fine ,qtl ,[SDV]Life Sciences [q-bio] ,[INFO]Computer Science [cs] ,poule ,évaluation génomique ,génotype ,déséquilibre de liaison - Abstract
La structure du déséquilibre de liaison (DL) au sein des populations en sélection impacte fortement la précision obtenue lors des études de cartographie de QTL ou lors de l’évaluation génomique des reproducteurs. Chez les oiseaux, la structure hétérogène du génome nécessite de décrire précisément le DL pour optimiser la sélection. L’utilisation des puces SNP haute densité pour le génotypage des populations de volailles est une opportunité pour approfondir notre connaissance de la structure du DL de ces populations. L’objectif de cette étude est d’acquérir une connaissance haute résolution de la structure du DL au sein de populations de poules de types ponte et chair. Nous avons analysé les génotypes (puce 600 K Affymetrix® Axiom® HD SNP) de 1541 animaux issus de 3 populations. L’étendue et le niveau du DL ont été estimés par le r2 moyen à distance physique donnée entre SNP. Cette étude met en évidence des différences importantes de structure du DL entre lignées et entre chromosomes. L’étendue et le niveau du DL sont plus importants dans les lignées de type ponte ou pour les macro-chromosomes et le chromosome Z. Ce niveau important de DL peut faciliter la détection de QTL sur ces chromosomes, mais peut également compliquer la localisation fine de polymorphismes causaux. A l’inverse, le faible niveau de DL observé sur les micro-chromosomes nécessite l’utilisation d’une forte densité de SNP pour détecter une association avec un phénotype, mais devrait permettre la cartographie fine d’un polymorphisme causal. Ces différences sont à prendre en considération pour définir une stratégie de génotypage économique et efficace pour la cartographie fine de QTL ou l’évaluation génomique., Knowledge of the linkage disequilibrium (LD) pattern is useful in animal genetic studies as it underlies mapping studies and genomic selection. This is all the more important in birds given the heterogeneous structure of the avian karyotype. Recently, the availability of the high density 600 K Affymetrix® Axiom® HD SNP genotyping array allowed to assess an in-depth knowledge of the LD pattern in chicken genome. The aim of the present study was to assess a higher resolution of the LD pattern in chicken genome in layer and broiler lines. In this study, we analyzed genotypes of 1541 animals from layers and broiler commercial populations to characterize their LD pattern. LD was measured by the average r2 value at a given physical distance between SNP. LD extended over a larger region for layer lines than for broiler line. Most differences between lines appeared at small interval distances (< 0.5Mb). LD extent and decay differed considerably between chromosomes categories. Average r2 values were higher for Z chromosome than for macro, intermediates and microchromosomes. The extent of useful LD observed for autosomal chromosomes was at least ten-fold longer for layer lines than for broiler. Finally, this study shed light on high LD for Z chromosome. The differences in LD pattern observed between chromosomes and chicken lines should be taken into account to define an economically efficient genotyping strategy.
- Published
- 2019
7. Méthodes statistiques pour identifier l'adaptation locale dans les populations continues et mélangées
- Author
-
MARTINS, Helena, Techniques de l'Ingénierie Médicale et de la Complexité - Informatique, Mathématiques et Applications, Grenoble - UMR 5525 (TIMC-IMAG), Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), Université Grenoble Alpes, Olivier François, and Michaël Blum
- Subjects
Biostatistiques ,[SDV.GEN.GPO]Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,Scan génomique ,Génétique des populations ,Population genetics ,Tests de différenciation des populations ,Linkage disequilibrium ,Population differentiation tests ,Admixed populations ,Biostatistics ,Genome scan for selection ,Populations mélangées ,Déséquilibre de liaison - Abstract
Finding genetic signatures of local adaptation is of great interest for many population genetic studies. Common approaches to sorting selective loci from their genomic background focus on the extreme values of the fixation index, FST, across loci. However, the computation of the fixation index becomes challenging when the population is genetically continuous, when predefining subpopulations is a difficult task, and in the presence of admixed individuals in the sample. In this thesis, we present a new method to identify loci under selection based on an extension of the FST statistic to samples with admixed individuals. Considering our goal of exploring statistical methods to identify local adaptation in admixed population, we included spatial data to compute ancestry coefficients and allele frequencies. To enrich our work, we investigated the effects of linkage disequilibrium and LD-pruning methods in genome scans for selection.; La recherche des signatures génétiques de l'adaptation locale est d'un grand intérêt pour de nombreuses études de génétique des populations. Les approches pour trier les loci sélectifs à partir de leur contexte génomique, se concentrent sur les valeurs extrêmes de l'indice de fixation, FST, à travers les loci. Cependant, le calcul de l'indice de fixation devient difficile lorsque la population est génétiquement continue, lorsque la prédéfinition des sous-populations est une tâche difficile et en présence d'individus mélangés dans l'échantillon. Dans cette thèse, nous présentons une nouvelle méthode pour identifier les loci sous sélection basée sur une extension de la statistique FST à des échantillons avec des individus mélangés. Considérant notre objectif d'explorer des méthodes statistiques pour identifier l'adaptation locale dans la population mélangée, nous avons inclus des données spatiales pour calculer les coefficients d'ascendance et les fréquences d'allèles. Pour enrichir notre travail, nous avons investigué les effets du déséquilibre de liaison et des méthodes d'élagage de LD dans les analyses de génomes pour la sélection.
- Published
- 2018
8. Design of a low density SNP chip for genotype imputation in layer chickens
- Author
-
HERRY, Florian, Hérault, Frédéric, Picard--Druet, David, Varenne, Amandine, Burlot, Thierry, Le Roy, Pascale, Allais, Sophie, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA), Novogen, ANR-10-GENOM_BTV-015 UtOpIGe, Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, and Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)
- Subjects
Animal biology ,Imputation accuracy ,Layer chickens ,Low density SNP panel ,Linkage disequilibrium ,polymorphisme nucléotidique simple (SNP) ,[SDV.BA]Life Sciences [q-bio]/Animal biology ,laying hen ,évaluation génomique ,poule pondeuse ,génotypage ,Biologie animale ,déséquilibre de liaison ,précision de sélection - Abstract
The main goal of selection is to choose breeders of the next generation among a set of selection candidates. In genomic selection, the choice of breeders is based on the use of information on DNA polymorphisms, in particular SNP, in addition of performance measures. Since 2013, a commercial high density genotyping chip (600,000 markers) for chicken allowed the implementation of genomic selection in layer and broiler breeding. However, genotyping costs with this chip still remain high for a routine use on a large number of selection candidates. Consequently, it is interesting to develop, at a lower cost, low density genotyping chips. To do so, a set of SNP markers has to be selected to enable an imputation (prediction) of missing genotypes with high accuracy on a high density chip (HD chip). In this perspective, we conducted various simulation studies to choose the optimal strategy for low density genotyping of two different lines of laying hen. Different low density genotyping chips were designed according to two methodologies: a choice of SNP depending on a clustering of SNP based on linkage disequilibrium threshold or a choice of SNP at regular intervals (kb) along each chromosome. Imputation accuracy was assessed as the mean correlation between true and imputed genotypes. Results showed that correlations were more sensitive to false imputation of SNPs with low Minor Allele Frequency (MAF) with the equidistant methodology. Imputation accuracy improved with SNP density and when a higher LD threshold is used for SNP selection. Given the particular structure of the avian genome with chromosomes of very heterogeneous sizes and extents of LD, imputation accuracy differed according to the type of chromosome. All the simulation studies showed that linkage disequilibrium methodology enabled to get better results of imputation than with equidistant methodology.
- Published
- 2018
9. Impact of the size of the reference population and kinship degree on low density genotyping strategies for genotype imputation in layer chickens
- Author
-
Burlot, Thierry, Herry, Florian, Hérault, Frédéric, Picard--Druet, David, Varenne, Amandine, Le Roy, Pascale, Allais, Sophie, Novogen, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA), ANR-10-GENOM_BTV-015 UtOpIGe, Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), AGROCAMPUS OUEST, and Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de la Recherche Agronomique (INRA)
- Subjects
Animal biology ,polymorphisme nucléotidique simple (SNP) ,Imputation accuracy ,Layer chickens ,Reference population ,Kinship degree ,[SDV.BA]Life Sciences [q-bio]/Animal biology ,laying hen ,évaluation génomique ,poule pondeuse ,génotypage ,Biologie animale ,déséquilibre de liaison ,précision de sélection - Abstract
The main goal of selection is to choose breeders of the next generation among a set of selection candidates. In genomic selection, the choice of breeders rests on the use of information on DNA polymorphisms, in particular SNP, in addition of performance measures. Since 2013, a commercial high density genotyping chip (600,000 markers) for chicken allowed the implementation of genomic selection in layer and broiler breeding. However, genotyping costs with this chip still remain high for a routine use on a large number of selection candidates. Consequently, it is interesting to develop, at a lower cost, low density genotyping chips. To do so, a set of SNP markers has to be selected to enable an imputation (prediction) of missing genotypes on a high density chip (HD chip). This imputation enables to predict missing genotypes of all selection candidates from high density genotyping of a reference population with phenotypes. In this perspective, according to the reference population, various simulation studies were conducted to choose the best strategy for low density genotyping of laying hen lines. Two different low density genotyping chips of 10K SNP were designed according to two methodologies: a choice of SNP depending on a clustering based on linkage disequilibrium threshold or a choice of SNP at regular intervals (kb) along each chromosome. Imputation accuracy was assessed as the mean correlation between true and imputed genotypes. Focusing on populationnal factors that can influence imputation accuracy, it is shown that imputation accuracy improves with an increase in the size of the reference population. By decreasing the kinship degree between reference and candidate population, it is seen that imputation accuracy decreases. Most importantly, results show that a key point in getting good imputations is to have the direct parents in the reference population. Finally, all different genotyping strategies focused on population factors show that linkage disequilibrium methodology enables to get better results of imputation than with equidistant methodology.
- Published
- 2018
10. Statistical Methods to Identify Local Adaptation in Continuous and Admixed Populations
- Author
-
MARTINS, Helena, STAR, ABES, Techniques de l'Ingénierie Médicale et de la Complexité - Informatique, Mathématiques et Applications, Grenoble - UMR 5525 (TIMC-IMAG), Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), Université Grenoble Alpes, Olivier François, and Michaël Blum
- Subjects
Biostatistiques ,[SDV.GEN.GPO]Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,Scan génomique ,Population genetics ,Tests de différenciation des populations ,Admixed populations ,Biostatistics ,Déséquilibre de liaison ,Génétique des populations ,Linkage disequilibrium ,[SDV.GEN.GPO] Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,Population differentiation tests ,Genome scan for selection ,Populations mélangées - Abstract
Finding genetic signatures of local adaptation is of great interest for many population genetic studies. Common approaches to sorting selective loci from their genomic background focus on the extreme values of the fixation index, FST, across loci. However, the computation of the fixation index becomes challenging when the population is genetically continuous, when predefining subpopulations is a difficult task, and in the presence of admixed individuals in the sample. In this thesis, we present a new method to identify loci under selection based on an extension of the FST statistic to samples with admixed individuals. Considering our goal of exploring statistical methods to identify local adaptation in admixed population, we included spatial data to compute ancestry coefficients and allele frequencies. To enrich our work, we investigated the effects of linkage disequilibrium and LD-pruning methods in genome scans for selection., La recherche des signatures génétiques de l'adaptation locale est d'un grand intérêt pour de nombreuses études de génétique des populations. Les approches pour trier les loci sélectifs à partir de leur contexte génomique, se concentrent sur les valeurs extrêmes de l'indice de fixation, FST, à travers les loci. Cependant, le calcul de l'indice de fixation devient difficile lorsque la population est génétiquement continue, lorsque la prédéfinition des sous-populations est une tâche difficile et en présence d'individus mélangés dans l'échantillon. Dans cette thèse, nous présentons une nouvelle méthode pour identifier les loci sous sélection basée sur une extension de la statistique FST à des échantillons avec des individus mélangés. Considérant notre objectif d'explorer des méthodes statistiques pour identifier l'adaptation locale dans la population mélangée, nous avons inclus des données spatiales pour calculer les coefficients d'ascendance et les fréquences d'allèles. Pour enrichir notre travail, nous avons investigué les effets du déséquilibre de liaison et des méthodes d'élagage de LD dans les analyses de génomes pour la sélection.
- Published
- 2018
11. Design of low density SNP chips for genotype imputation in layer chicken
- Author
-
Sophie Allais, Pascale Le Roy, Amandine Varenne, David Picard Druet, Thierry Burlot, Florian Herry, Frédéric Hérault, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), Novogen, ANR-10-GENOM_BTV-015 UtOpIGe, and AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA)
- Subjects
0301 basic medicine ,Linkage disequilibrium ,laying hen ,fréquence allélique ,Gene Frequency ,Statistics ,déséquilibre de liaison ,Genetics (clinical) ,Oligonucleotide Array Sequence Analysis ,Genetics ,Animal biology ,education.field_of_study ,degré de parenté ,[SDV.BA]Life Sciences [q-bio]/Animal biology ,évaluation génomique ,MAF ,SNP genotyping ,Genetic gain ,allele frequency ,Research Article ,Degree of kinship ,polymorphisme nucléotidique simple (SNP) ,lcsh:QH426-470 ,Genotype ,caractérisation génomique ,Population ,Layer chickens ,Biology ,Polymorphism, Single Nucleotide ,Chromosomes ,Imputation accuracy ,03 medical and health sciences ,Biologie animale ,Animals ,SNP ,education ,Genotyping ,précision de sélection ,SNP density ,poule pondeuse ,Minor allele frequency ,lcsh:Genetics ,030104 developmental biology ,génotypage ,Low density chip ,Chickens ,Imputation (genetics) - Abstract
Background[br/] The main goal of selection is to achieve genetic gain for a population by choosing the best breeders among a set of selection candidates. Since 2013, the use of a high density genotyping chip (600K Affymetrix (R) Axiom (R) HD genotyping array) for chicken has enabled the implementation of genomic selection in layer and broiler breeding, but the genotyping costs remain high for a routine use on a large number of selection candidates. It has thus been deemed interesting to develop a low density genotyping chip that would induce lower costs. In this perspective, various simulation studies have been conducted to find the best way to select a set of SNPs for low density genotyping of two laying hen lines.[br/] Results[br/] To design low density SNP chips, two methodologies, based on equidistance (EQ) or on linkage disequilibrium (LD) were compared. Imputation accuracy was assessed as the mean correlation between true and imputed genotypes. The results showed correlations more sensitive to false imputation of SNPs having low Minor Allele Frequency (MAF) when the EQ methodology was used. An increase in imputation accuracy was obtained when SNP density was increased, either through an increase in the number of selected windows on a chromosome or through the rise of the LD threshold. Moreover, the results varied depending on the type of chromosome (macro or micro-chromosome). The LD methodology enabled to optimize the number of SNPs, by reducing the SNP density on macro-chromosomes and by increasing it on micro-chromosomes. Imputation accuracy also increased when the size of the reference population was increased. Conversely, imputation accuracy decreased when the degree of kinship between reference and candidate populations was reduced. Finally, adding selection candidates' dams in the reference population, in addition to their sire, enabled to get better imputation results.[br/] Conclusions[br/] Whichever the SNP chip, the methodology, and the scenario studied, highly accurate imputations were obtained, with mean correlations higher than 0.83. The key point to achieve good imputation results is to take into account chicken lines' LD when designing a low density SNP chip, and to include the candidates' direct parents in the reference population.
- Published
- 2018
- Full Text
- View/download PDF
12. A linkage disequilibrium study in layers and broiler commercial chicken populations
- Author
-
Hérault, Frédéric, HERRY, Florian, Varenne, Amandine, Burlot, Thierry, Picard--Druet, David, Recoquillay, Julien, Macé, Camille, Fagnoul, Frédéric, Allais, Sophie, Le Roy, Pascale, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA), Novogen, Hubbard, ANR-10-GENOM_BTV-015 UtOpIGe, ANR-10-GENM-0015,UtOpIGe,Vers une Utilisation Optimale de l'Information Génomique dans les schémas pyramidaux(2010), Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), AGROCAMPUS OUEST, and Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de la Recherche Agronomique (INRA)
- Subjects
Animal biology ,polymorphisme nucléotidique simple (SNP) ,broilers ,[SDV.BA]Life Sciences [q-bio]/Animal biology ,layer ,broiler ,linkage disequilibrium ,génome ,Biologie animale ,déséquilibre de liaison ,poulet de chair - Abstract
Knowledge of the linkage disequilibrium (LD) pattern is useful in animal genetic studies as it underlies mapping studies and genomic selection. Recently, the availability of the high density 600K Affymetrix® Axiom® HD SNP genotyping array allows to asses a higher resolution of the LD structure in chicken genome. In this study, we analysed genotypes of 1541 animals from layers and broiler commercial populations to characterize their LD pattern. LD was measured by the average r2 value at a given physical distance between SNP. LD extends over a larger region for layers line than for broiler line. Most differences between lines appeared at small interval distance (< 0.5Mb). LD extent and decay differed considerably between chromosome categories. Average r2 values were higher for Z chromosome than for macro, intermediates and microchromosomes. The extent of useful LD observed for autosomal chromosomes is at least tenfold longer for layers line than for broiler. Finally, this study shed light on high LD for the Z chromosome. The differences in LD pattern observed between chromosomes and chicken lines should be taken into account to define an economically efficient genotyping strategy.
- Published
- 2018
13. Modélisation du déséquilibre de liaison en génomique des populations par méthodes d'optimisation
- Author
-
Dias Alves, Thomas, Techniques de l'Ingénierie Médicale et de la Complexité - Informatique, Mathématiques et Applications, Grenoble - UMR 5525 (TIMC-IMAG), Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), Université Grenoble Alpes, Michaël Blum, Julien Mairal, and STAR, ABES
- Subjects
Optimization ,Linkage disequillibrium ,[SDV.GEN.GPO]Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,[SDV.GEN.GPO] Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,Haplotype ,Optimisation ,[MATH.MATH-ST] Mathematics [math]/Statistics [math.ST] ,Déséquilibre de liaison - Abstract
We present a new formalism and new methods to model linkage disequilibrium and to account for haplotype structure of population genomics data. Modeling relies on an optimization problem with constraints that is solved using dynamic programming. The algorithmic cost of proposed methods is linear, which is a desirable property to process large datasets.First, we applied our framework to study admixed populations and perform local ancestry inference. Our method is applied to simulated genotypes of admixed human populations and to real genotypes from admixed Populus species.Second, we developed our optimization framework to perform haploptype phasing and imputation based on a population of genotypes. All optimization methods have been developed in a Python package called Loter., Nous présentons un nouveau formalisme et des nouvelles méthodes pour modéliser le déséquilibre de liaison et tenir compte de la structure en haplotypes pour les données issues de la génomique des populations. La modélisation repose sur un problème d'optimisation avec contraintes qui est résolue avec un algorithme de programmation dynamique. Les méthodes établies ont toutes l'avantage d'avoir un coût algorithmique linéaire et donc de pouvoir traiter de grands jeux de données.Dans un premier temps, nous avons appliqué notre approche à l'étude des populations métisses et plus particulièrement au problème d'inférence des coefficients de métissage locaux.Notre méthode a été appliquée à des génotypes simulés de métissage humain ainsi qu'à des vrais génotypes obtenus dans des populations métisses de peupliers.Dans un second temps, nous avons développé notre formalisme d'optimisation pour traiter de l'inférence des haplotypes à partir des génotypes d'une population.L'ensemble de ces méthodes d'optimisation a été développé dans un module Python qui s'appelle Loter.
- Published
- 2017
14. Use of modern tomato breeding germplasm for deciphering the genetic control of agronomical traits by Genome Wide Association study
- Author
-
Nicolas Samson, Julien Bonnet, Stéphane Grenier, Mathilde Causse, Guillaume Bauchet, Laurent Grivet, Unité de recherche Génétique et amélioration des fruits et légumes (GALF), Institut National de la Recherche Agronomique (INRA), Syngenta France, Boyce Thompson Institute Cornell, Ithaca College, and Génétique et Amélioration des Fruits et Légumes (GAFL)
- Subjects
0106 biological sciences ,0301 basic medicine ,Germplasm ,Linkage disequilibrium ,haplotype ,Genome-wide association study ,tomato ,germoplasme ,01 natural sciences ,Linkage Disequilibrium ,tomate ,Gene Frequency ,Solanum lycopersicum ,déséquilibre de liaison ,2. Zero hunger ,Genetics ,Chromosome Mapping ,food and beverages ,General Medicine ,genêtic variation ,Phenotype ,diversité génétique ,architecture génétique ,genome wide association study (GWAS) ,caractère de sélection ,Biotechnology ,DNA, Plant ,Genotype ,Quantitative Trait Loci ,introgression ,Outcrossing ,Quantitative trait locus ,Biology ,Polymorphism, Single Nucleotide ,03 medical and health sciences ,congruence moléculaire ,[SDV.BV]Life Sciences [q-bio]/Vegetal Biology ,Genetic Association Studies ,Genetic association ,Genetic diversity ,matériel génétique ,Genetic architecture ,Plant Breeding ,030104 developmental biology ,Haplotypes ,Agronomy and Crop Science ,seed collections ,contrôle génétique ,010606 plant biology & botany - Abstract
A panel of 300 tomato accessions including breeding materials was built and characterized with >11,000 SNP. A population structure in six subgroups was identified. Strong heterogeneity in linkage disequilibrium and recombination landscape among groups and chromosomes was shown. GWAS identified several associations for fruit weight, earliness and plant growth. Genome-wide association studies (GWAS) have become a method of choice in quantitative trait dissection. First limited to highly polymorphic and outcrossing species, it is now applied in horticultural crops, notably in tomato. Until now GWAS in tomato has been performed on panels of heirloom and wild accessions. Using modern breeding materials would be of direct interest for breeding purpose. To implement GWAS on a large panel of 300 tomato accessions including 168 breeding lines, this study assessed the genetic diversity and linkage disequilibrium decay and revealed the population structure and performed GWA experiment. Genetic diversity and population structure analyses were based on molecular markers (>11,000 SNP) covering the whole genome. Six genetic subgroups were revealed and associated to traits of agronomical interest, such as fruit weight and disease resistance. Estimates of linkage disequilibrium highlighted the heterogeneity of its decay among genetic subgroups. Haplotype definition allowed a fine characterization of the groups and their recombination landscape revealing the patterns of admixture along the genome. Selection footprints showed results in congruence with introgressions. Taken together, all these elements refined our knowledge of the genetic material included in this panel and allowed the identification of several associations for fruit weight, plant growth and earliness, deciphering the genetic architecture of these complex traits and identifying several new loci useful for tomato breeding.
- Published
- 2017
- Full Text
- View/download PDF
15. Select SNP 4 Imputation (SS4I) : un outil simple de sélection de SNP en fonction du DL
- Author
-
Herault, Frédéric, Yon, Jérémy, Herry, Florian, Allais, Sophie, Le Roy, Pascale, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de la Recherche Agronomique (INRA), and AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA)
- Subjects
polymorphisme nucléotidique simple (SNP) ,outil informatique ,génotypage ,génome ,[SDV]Life Sciences [q-bio] ,gallus gallus ,imputation ,déséquilibre de liaison - Abstract
Métaprogramme Selgen; Select SNP 4 Imputation (SS4I) : un outil simple de sélection de SNP en fonction du DL. Réunion du projet Selgen INCoMINGS
- Published
- 2016
16. Detecting molecular footprint of local adaptation in Zymoseptoria tritici
- Author
-
Genissel, Anne, Gout, Lilian, BIOlogie et GEstion des Risques en agriculture (BIOGER), and Institut National de la Recherche Agronomique (INRA)-AgroParisTech
- Subjects
Zymoseptoria tritici ,natural populations ,genetic differentiation ,adaptation ,linkage disequilibrium ,populations naturelles ,differenciation genetique ,desequilibre de liaison ,[SDV]Life Sciences [q-bio] - Abstract
National audience; Zymoseptoria tritici (Zt) is one of the most common pathogen of wheat and yet the genetic basis ofadaptation in this species is largely unknown. Population genetics studies using neutral markers suggest for the most part that there is a low level of genetic differentiation between natural population samples in Zt. Using new generation sequencing data, now we can provide an in depth analysis of the genetic variation segregating in natural populations, and better understand the mode and tempo of genome evolution at the intraspecific level. The aim of this work was to identify the genes / genome regions that are under extreme genetic differentiation between two French population samples that differ in environment, collected in the North and South of France. To reach this goal, we used new generation sequencing data from 30 isolates. We found a large genetic diversity for both single nucleotide polymorphisms and structural variants within and between population samples. Many polymorphic sites throughout the genome were highly differentiated between the population samples, especially we discovered a large inversion on chromosome 7. We detailed the nature of geneticvariants in this specific region. We also described the pattern of linkage disequilibrium and quantify the skew in allele frequency spectrum across inverted regions to understand the nature of the selection in action. Last, we discuss the potential role of inversions in local adaptation.
- Published
- 2016
17. On the accuracy of genomic selection
- Author
-
Charles-Elie Rabier, Torben Asp, Brigitte Mangin, Philippe Barre, Gilles Charmet, Unité de Mathématiques et Informatique Appliquées de Toulouse (MIAT INRA), Institut National de la Recherche Agronomique (INRA), Unité de Recherche Pluridisciplinaire Prairies et Plantes Fourragères (P3F), Department of Molecular Biology and Genetics, Al-Farabi Kazakh National University [Almaty] (KazNU), Génétique Diversité et Ecophysiologie des Céréales (GDEC), Institut National de la Recherche Agronomique (INRA)-Université Blaise Pascal - Clermont-Ferrand 2 (UBP), Laboratoire des interactions plantes micro-organismes (LIPM), Institut National de la Recherche Agronomique (INRA)-Centre National de la Recherche Scientifique (CNRS), Projet CROPDL, Metaprogramme INRA SELGEN, Al-Farabi Kazakh National University, and Centre National de la Recherche Scientifique (CNRS)-Institut National de la Recherche Agronomique (INRA)
- Subjects
0301 basic medicine ,[SDV.SA]Life Sciences [q-bio]/Agricultural sciences ,Linkage disequilibrium ,Economics ,Economic Models ,Social Sciences ,Plant Weeds ,lcsh:Medicine ,Genome-wide association study ,Breeding ,marqueur ,Linkage Disequilibrium ,genomic selection ,Mathematical and Statistical Techniques ,Statistics ,déséquilibre de liaison ,Proxy (statistics) ,lcsh:Science ,Genetics ,Multidisciplinary ,Simulation and Modeling ,qtl ,Regression analysis ,Genomics ,Plants ,exactness ,Agricultural sciences ,Phenotype ,Physical Sciences ,Statistics (Mathematics) ,Research Article ,exactitude ,True breeding organism ,Population Size ,Quantitative Trait Loci ,Context (language use) ,Quantitative trait locus ,Biology ,Research and Analysis Methods ,Polymorphism, Single Nucleotide ,03 medical and health sciences ,Population Metrics ,Effective Population Size ,Genome-Wide Association Studies ,Grasses ,Statistical Methods ,Selection, Genetic ,sélection génomique ,Selection (genetic algorithm) ,marker ,Evolutionary Biology ,Population Biology ,lcsh:R ,Organisms ,Biology and Life Sciences ,Computational Biology ,Human Genetics ,Models, Theoretical ,Genome Analysis ,030104 developmental biology ,Genetic Loci ,lcsh:Q ,Ryegrass ,Mathematics ,Population Genetics ,Sciences agricoles ,Forecasting - Abstract
Genomic selection is focused on prediction of breeding values of selection candidates by means of high density of markers. It relies on the assumption that all quantitative trait loci (QTLs) tend to be in strong linkage disequilibrium (LD) with at least one marker. In this context, we present theoretical results regarding the accuracy of genomic selection, i.e., the correlation between predicted and true breeding values. Typically, for individuals (so-called test individuals), breeding values are predicted by means of markers, using marker effects estimated by fitting a ridge regression model to a set of training individuals. We present a theoretical expression for the accuracy; this expression is suitable for any configurations of LD between QTLs and markers. We also introduce a new accuracy proxy that is free of the QTL parameters and easily computable; it outperforms the proxies suggested in the literature, in particular, those based on an estimated effective number of independent loci (Me ). The theoretical formula, the new proxy, and existing proxies were compared for simulated data, and the results point to the validity of our approach. The calculations were also illustrated on a new perennial ryegrass set (367 individuals) genotyped for 24,957 single nucleotide polymorphisms (SNPs). In this case, most of the proxies studied yielded similar results because of the lack of markers for coverage of the entire genome (2.7 Gb).
- Published
- 2016
- Full Text
- View/download PDF
18. Spatial Clustering of Linkage Disequilibrium blocks for Genome-Wide Association Studies
- Author
-
Dehman, Alia, Laboratoire de Mathématiques et Modélisation d'Evry, Institut National de la Recherche Agronomique (INRA)-Université d'Évry-Val-d'Essonne (UEVE)-Centre National de la Recherche Scientifique (CNRS), Université d'Evry Val d'Essonne, Université Paris-Saclay, Christophe Ambroise(christophe.ambroise@genopole.cnrs.fr), Pierre Neuvial(pierre.neuvial@genopole.cnrs.fr), Laboratoire de Mathématiques et Modélisation d'Evry (LaMME), Institut National de la Recherche Agronomique (INRA)-Université d'Évry-Val-d'Essonne (UEVE)-ENSIIE-Centre National de la Recherche Scientifique (CNRS), Institut National de la Recherche Agronomique (INRA) - Université d'Evry-Val d'Essonne - ENSIIE - Centre National de la Recherche Scientifique (CNRS), and Dehman, Alia
- Subjects
[SDV.GEN]Life Sciences [q-bio]/Genetics ,Penalized regression ,Classification hiérarchique ,[SDV.GEN] Life Sciences [q-bio]/Genetics ,Model selection ,Linkage Disequilibrium ,Hierarchical clustering ,Gap statistic ,Déséquilibre de liaison ,[STAT] Statistics [stat] ,Sélection de modèle ,[STAT]Statistics [stat] ,Group lasso ,Genome-Wide Association Studies ,Régression pénalisée - Abstract
With recent development of high-throughput genotyping technologies, the usage of Genome-Wide Association Studies (GWAS) has become widespread in genetic research. By screening large portions of the genome, these studies aim to characterize genetic factors involved in the development of complex genetic diseases.GWAS are also based on the existence of statistical dependencies, called Linkage Disequilibrium (LD) usually observed between nearby loci on DNA. LD is defined as the non-random association of alleles at different loci on the same chromosome or on different chromosomes in a population. This biological feature is of fundamental importance in association studies as it provides a fine location of unobserved causal mutations using adjacent genetic markers. Nevertheless, the complex block structure induced by LD as well as the large volume of genetic data are key issues that have arisen with GWA studies.The contributions presented in this manuscript are in twofold, both methodological and algorithmic. On the methodological part, we propose a three-step approach that explicitly takes advantage of the grouping structure induced by LD in order to identify common variants which may have been missed by single marker analyses. In the first step, we perform a hierarchical clustering of SNPs with an adjacency constraint using LD as a similarity measure. In the second step, we apply a model selection approach to the obtained hierarchy in order to define LD blocks. Finally, we perform Group Lasso regression on the inferred LD blocks. The efficiency of the proposed approach is investigated compared to state-of-the art regression methods on simulated, semi-simulated and real GWAS data.On the algorithmic part, we focus on the spatially-constrained hierarchical clustering algorithm whose quadratic time complexity is not adapted to the high-dimensionality of GWAS data. We then present, in this manuscript, an efficient implementation of such an algorithm in the general context of any similarity measure. By introducing a user-parameter h and using the min-heap structure, we obtain a sub-quadratic time complexity of the adjacency-constrained hierarchical clustering algorithm, as well as a linear space complexity in the number of items to be clustered. The interest of this novel algorithm is illustrated in GWAS applications., Avec le développement récent des technologies de génotypage à haut débit, l'utilisation des études d'association pangénomiques (GWAS) est devenue très répandue dans la recherche génétique. Au moyen de criblage de grandes parties du génome, ces études visent à caractériser les facteurs génétiques impliqués dans le développement de maladies génétiques complexes.Les GWAS sont également basées sur l'existence de dépendances statistiques, appelées déséquilibre de liaison(DL), habituellement observées entre des loci qui sont proches dans l'ADN. Le DL est défini comme l'association non aléatoire d'allèles à des loci différents sur le même chromosome ou sur des chromosomes différents dans unepopulation. Cette caractéristique biologique est d'une importance fondamentale dans les études d'association car elle permetla localisation précise des mutations causales en utilisant les marqueurs génétiques adjacents. Néanmoins, la structure de blocs complexe induite par le DL ainsi que le grand volume de données génétiques constituent les principaux enjeux soulevés par les études GWAS.Les contributions présentées dans ce manuscrit comportent un double aspect, à la fois méthodologique et algorithmique. Sur le plan méthodologie, nous proposons une approche en trois étapes qui tire profit de la structure de groupes induite par le DL afin d'identifier des variants communs qui pourraient avoir été manquées par l'analyse simple marqueur. Dans une première étape, nous effectuons une classification hiérarchique des SNPs avec une contrainte d'adjacence et en utilisant le DL comme mesure de similarité. Dans une seconde étape, nous appliquons une approche de sélection de modèle à la hiérarchie obtenue afin de définir des blocs de DL. Enfin, nous appliquons le modèle de régression Group Lasso sur les blocs de DLinférés. L'efficacité de l'approche proposée est comparée à celle des approches de régression standards sur des données simulées, semi-simulées et réelles de GWAS.Sur le plan algorithmique, nous nous concentrons sur l'algorithme de classification hiérarchique avec contrainte spatiale dont la complexité quadratique en temps n'est pas adaptée à la grande dimension des données GWAS. Ainsi, nous présentons, dans ce manuscrit, une mise en œuvre efficace d'un tel algorithme dans le contexte général de n'importe quelle mesure de similarité. En introduisant un paramètre $h$ défini par l'utilisateur et en utilisant la structure de tas-min, nous obtenons une complexité sous-quadratique en temps de l'algorithme de classification hiérarchie avec contrainte d'adjacence, ainsi qu'une complexité linéaire en mémoire en le nombre d'éléments à classer. L'intérêt de ce nouvel algorithme est illustré dans des applications GWAS.
- Published
- 2015
19. Optimization of statistical methods for QTL detection
- Author
-
Jacquin, Laval, Génétique Physiologie et Systèmes d'Elevage (GenPhySE ), École nationale supérieure agronomique de Toulouse [ENSAT]-Institut National de la Recherche Agronomique (INRA)-Ecole Nationale Vétérinaire de Toulouse (ENVT), Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées, Institut National Polytechnique (Toulouse), Elsen Jean-Michel, Gilbert Hélène, Institut National Polytechnique de Toulouse - INPT (FRANCE), Station d'Amélioration Génétique des Animaux (SAGA), Institut National de la Recherche Agronomique (INRA), and Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE)
- Subjects
haplotypes ,locus à effet quantitatif ,ld ,[SDV]Life Sciences [q-bio] ,Haplotypes ,liaison ,Locus à effets quantitatifs (QTL) ,Déséquilibre de liaison (LD) ,Association ,Robustesse statistique ,STATISQUES ,[INFO]Computer Science [cs] ,déséquilibre de liaison ,ComputingMilieux_MISCELLANEOUS ,Distance matricielle ,robustesse statistique ,Liaison ,VARIABILITE ,qtl ,puissance statistique ,association ,distance matricielle ,Puissance statistique ,GENOMIQUE ,METHODES - Abstract
L’avènement du génotypage à haut débit permet aujourd’hui de mieux exploiter le phénomène d’association, appelé déséquilibre de liaison (LD), qui existe entre les allèles de différents loci sur le génome. Dans ce contexte, l’utilité de certains modèles utilisés en cartographie de locus à effets quantitatifs (QTL) est remise en question. Les objectifs de ce travail étaient de discriminer entre des modèles utilisés en routine en cartographie et d’apporter des éclaircissements sur la meilleure façon d’exploiter le LD, par l’utilisation d’haplotypes, afin d’optimiser les modèles basés sur ce concept. On montre que les modèles uni-marqueur de liaison, développés en génétique il y a vingtaine d’années, comportent peu d’intérêts aujourd’hui avec le génotypage à haut débit. Dans ce contexte, on montre que les modèles uni-marqueur d’association comportent plus d’avantages que les modèles uni-marqueur de liaison, surtout pour des QTL ayant un effet petit ou modéré sur le phénotype, à condition de bien maîtriser la structure génétique entre individus. Les puissances et les robustesses statistiques de ces modèles ont été étudiées, à la fois sur le plan théorique et par simulations, afin de valider les résultats obtenus pour la comparaison de l’association avec la liaison. Toutefois, les modèles uni-marqueur ne sont pas aussi efficaces que les modèles utilisant des haplotypes dans la prise en compte du LD pour une cartographie fine de QTL. Des propriétés mathématiques reliées à la cartographie de QTL par l’exploitation du LD multiallélique capté par les modèles haplotypiques ont été explicitées et étudiées à l’aide d’une distance matricielle définie entre deux positions sur le génome. Cette distance a été exprimée algébriquement comme une fonction des coefficients du LD multiallélique. Les propriétés mathématiques liées à cette fonction montrent qu’il est difficile de bien exploiter le LD multiallélique, pour un génotypage à haut débit, si l’on ne tient pas compte uniquement de la similarité totale entre des haplotypes. Des études sur données réelles et simulées ont illustré ces propriétés et montrent une corrélation supérieure à 0.9 entre une statistique basée sur la distance matricielle et des résultats de cartographie. Cette forte corrélation a donné lieu à la proposition d’une méthode, basée sur la distance matricielle, qui aide à discriminer entre les modèles utilisés en cartographie.
- Published
- 2014
20. La consanguinité à l'ère du génome haut-débit : estimations et applications
- Author
-
Gazal, Steven, Variabilité Génétique et Maladies Humaines, Institut Universitaire d'Hématologie (IUH), Université Paris Diderot - Paris 7 (UPD7)-Université Paris Diderot - Paris 7 (UPD7)-Institut National de la Santé et de la Recherche Médicale (INSERM), Université Paris Sud - Paris XI, Emmanuelle Génin, and STAR, ABES
- Subjects
Hidden Markov model ,Consanguinité ,Population genetics ,Génétique épidémiologique ,Génétique statistique ,Homozygotie-par-descendance ,Alzheimer's disease ,Comparison of methods ,Maladie d’Alzheimer ,Déséquilibre de liaison ,HapMap ,Consanguinity ,Génétique des populations ,[SDV.SPEE] Life Sciences [q-bio]/Santé publique et épidémiologie ,Homozygosity mapping ,Comparaison de méthodes ,Linkage disequilibrium ,Cartographie par homozygotie ,Genetic epidemiology ,[SDV.SPEE]Life Sciences [q-bio]/Santé publique et épidémiologie ,Homozygosity-by-descent ,Chaine de Markov cachée ,Statistical genetics - Abstract
An individual is said to be inbred if his parents are related and if his genealogy contains at least one inbreeding loop leading to a common ancestor. The inbreeding coefficient of an individual is defined as the probability that the individual has received two alleles identical by descent, coming from a single allele present in a common ancestor, at a random marker on the genome. The inbreeding coefficient is a central parameter in genetics, and is used in population genetics to characterize the population structure, and also in genetic epidemiology to search for genetic factors involved in recessive diseases.The inbreeding coefficient was traditionally estimated from genealogies, but methods have been developed to avoid genealogies and to estimate this coefficient from the information provided by genetic markers distributed along the genome.With the advances in high-throughput genotyping techniques, it is now possible to genotype hundreds of thousands of markers for one individual, and to use these methods to reconstruct the regions of identity by descent on his genome and estimate a genomic inbreeding coefficient. There is currently no consensus on the best strategy to adopt with these dense marker maps, in particular to take into account dependencies between alleles at different markers (linkage disequilibrium).In this thesis, we evaluated the different available methods through simulations using real data with realistic patterns of linkage disequilibrium. We highlighted an interesting approach that consists in generating several submaps to minimize linkage disequilibrium, estimating an inbreeding coefficient of each of the submaps based on a hidden Markov method implemented in FEstim software, and taking as estimator the median of these different estimates. The advantage of this approach is that it can be used on any sample size, even on an individual, since it requires no linkage disequilibrium estimate. FEstim is a maximum likelihood estimator, which allows testing whether the inbreeding coefficient is significantly different from zero and determining the most probable mating type of the parents. Finally, through the identification of homozygous regions shared by several consanguineous patients, our strategy permits the identification of recessive mutations involved in monogenic and multifactorial diseases.To facilitate the use of our method, we developed the pipeline FSuite, to interpret results of population genetics and genetic epidemiology studies, as shown on the HapMap III reference panel, and on a case-control Alzheimer's disease data., Un individu est dit consanguin si ses parents sont apparentés et s’il existe donc dans sa généalogie au moins une boucle de consanguinité aboutissant à un ancêtre commun. Le coefficient de consanguinité de l’individu est par définition la probabilité pour qu’à un point pris au hasard sur le génome, l’individu ait reçu deux allèles identiques par descendance qui proviennent d’un seul allèle présent chez un des ancêtres communs. Ce coefficient de consanguinité est un paramètre central de la génétique qui est utilisé en génétique des populations pour caractériser la structure des populations, mais également pour rechercher des facteurs génétiques impliqués dans les maladies. Le coefficient de consanguinité était classiquement estimé à partir des généalogies, mais des méthodes ont été développées pour s’affranchir des généalogies et l’estimer à partir de l’information apportée par des marqueurs génétiques répartis sur l’ensemble du génome.Grâce aux progrès des techniques de génotypage haut-débit, il est possible aujourd’hui d’obtenir les génotypes d’un individu sur des centaines de milliers de marqueurs et d’utiliser ces méthodes pour reconstruire les régions d’identité par descendance sur son génome et estimer un coefficient de consanguinité génomique. Il n’existe actuellement pas de consensus sur la meilleure stratégie à adopter sur ces cartes denses de marqueurs en particulier pour gérer les dépendances qui existent entre les allèles aux différents marqueurs (déséquilibre de liaison). Dans cette thèse, nous avons évalué les différentes méthodes disponibles à partir de simulations réalisées en utilisant de vraies données avec des schémas de déséquilibre de liaison réalistes. Nous avons montré qu’une approche intéressante consistait à générer plusieurs sous-cartes de marqueurs dans lesquelles le déséquilibre de liaison est minimal, d’estimer un coefficient de consanguinité sur chacune des sous-cartes par une méthode basée sur une chaîne de Markov cachée implémentée dans le logiciel FEstim et de prendre comme estimateur la médiane de ces différentes estimations. L’avantage de cette approche est qu’elle est utilisable sur n’importe quelle taille d’échantillon, voire sur un seul individu, puisqu’elle ne demande pas d’estimer les déséquilibres de liaison. L’estimateur donné par FEstim étant un estimateur du maximum de vraisemblance, il est également possible de tester si le coefficient de consanguinité est significativement différent de zéro et de déterminer la relation de parenté des parents la plus vraisemblable parmi un ensemble de relations. Enfin, en permettant l’identification de régions d’homozygoties communes à plusieurs malades consanguins, notre stratégie peut permettre l’identification des mutations récessives impliquées dans les maladies monogéniques ou multifactorielles.Pour que la méthode que nous proposons soit facilement utilisable, nous avons développé le pipeline, FSuite, permettant d’interpréter facilement les résultats d’études de génétique de populations et de génétique épidémiologique comme illustré sur le panel de référence HapMap III, et sur un jeu de données cas-témoins de la maladie d’Alzheimer.
- Published
- 2014
21. Applications du processus ancestral avec recombinaison et conversion en génétique statistique
- Author
-
Saidi, Lamiae and Lessard, Sabin
- Subjects
recombinaison ,Ancestral process ,processus ancestral ,variabilité génétique ,genetic variability ,coalescent ,conversion ,déséquilibre de liaison ,modèle de Moran ,Moran model ,linkage disequilibrium ,recombination - Abstract
Le processus ancestral est appliqué pour étudier la variabilité génétique et la mesure de déséquilibre de liaison de séquences d’ADN, et faire de l’inférence statistique sur les divers facteurs responsables de cette variabilité. En tenant compte, en premier lieu, des facteurs de dérive génétique, de mutation, et de recombinaison, les calculs exacts de la mesure de déséquilibre de liaison de deux loci sont retrouvés. De plus, une approximation du processus exact, SMC (sequentially Markov chain), est utilisée pour trouver la mesure d’association à deux loci, et une formule de covariance pour calculer cette mesure est corrigée. En intégrant le facteur de conversion dans le modèle de Moran, on trouve l’espérance des mesures de polymorphisme exprimées par les espérances des mesures de variation intra-locus et inter-locus. Celles-ci sont calculées à l’aide de temps espérés dans les états ancestraux. De plus, l’espérance du déséquilibre de liaison est trouvée et il est montré qu’elle diminue quand le taux de recombinaison augmente. En utilisant ces résultats théoriques, on présente une méthode pour estimer les paramètres de mutation, de recombinaison, et de conversion., The ancestral process is applied to investigate the amount of DNA variation and the amount of linkage disequilibrium ; it is also applied to make statistical inference about the multiple factors responsible for this variation. Considering genetic drift, mutation, and recombination events, the exact solutions for linkage disequilibrium between two loci are obtained. Furthermore, the association measure between two loci is obtained by using an approximation of the exact process, SMC (sequentially Markov chain), and correcting a covariance formula. After introducing intrachromosomal gene conversion under the Moran model, the expected amounts of variation within and between two loci are obtained using expected times spent in the ancestral states. Furthermore, the expectation of linkage disequilibrium is obtained and it is shown to decrease as the recombination rate is increased. Using these theoretical results, a method for estimating the mutation, recombination and gene conversion parameters is presented., Les diagrammes de transitions d'états ont été réalisés avec le logiciel Latex.
- Published
- 2014
22. Genome-wide distribution of genetic diversity and linkage disequilibrium in a mass-selected population of maritime pine
- Author
-
Fikret Isik, Laurent Bouffier, Jean-Baptiste Lamy, Eric Mandrou, Jeffrey B. Endelman, Marco C. A. M. Bink, Joost van Heerwaarden, Christophe Plomion, François Ehrenmann, Isabelle Lesur, Emilie Chancerel, Biodiversité, Gènes & Communautés (BioGeCo), Institut National de la Recherche Agronomique (INRA)-Université de Bordeaux (UB), University of Wisconsin-Madison, HelixVenture, Department of Forestry and Environmental Resources, North Carolina State University [Raleigh] (NC State), University of North Carolina System (UNC)-University of North Carolina System (UNC), Biometris, and Wageningen University and Research [Wageningen] (WUR)
- Subjects
Linkage disequilibrium ,Genotyping Techniques ,Genetic Linkage ,[SDV]Life Sciences [q-bio] ,Pinus pinaster ,polymorphisme ,cryptomeria-japonica ,marqueur ,Wiskundige en Statistische Methoden - Biometris ,Linkage Disequilibrium ,Genetic diversity ,Population genomics ,Domestication ,Effective population size ,Gene Frequency ,déséquilibre de liaison ,Association mapping ,Genetics ,education.field_of_study ,Linkage map ,Chromosome Mapping ,domestication des espèces ,Genomics ,PE&RC ,Biometris ,Plant Production Systems ,diversité génétique ,Genetic structure ,Algorithms ,Genome, Plant ,expression des gènes ,Biotechnology ,Research Article ,Genotype ,Population ,Forest tree ,Outcrossing ,Biology ,Polymorphism, Single Nucleotide ,white spruce ,complex traits ,loblolly-pine ,cloned population ,education ,Mathematical and Statistical Methods - Biometris ,Genomic selection ,multilocus genotype data ,consensus map ,Genetic Variation ,15. Life on land ,Pinus ,Breeding program ,Recombination ,genetic diversity ,linkage disequilibrium ,recombination ,linkage map ,domestication ,breeding program ,forest tree ,genomics ,genomic selection ,density-estimation ,Evolutionary biology ,Plantaardige Productiesystemen ,breeding values ,cartographie ,forest trees - Abstract
The accessibility of high-throughput genotyping technologies has contributed greatly to the development of genomic resources in non-model organisms. High-density genotyping arrays have only recently been developed for some economically important species such as conifers. The potential for using genomic technologies in association mapping and breeding depends largely on the genome wide patterns of diversity and linkage disequilibrium in current breeding populations. This study aims to deepen our knowledge regarding these issues in maritime pine, the first species used for reforestation in south western Europe. Using a new map merging algorithm, we first established a 1,712 cM composite linkage map (comprising 1,838 SNP markers in 12 linkage groups) by bringing together three already available genetic maps. Using rigorous statistical testing based on kernel density estimation and resampling we identified cold and hot spots of recombination. In parallel, 186 unrelated trees of a mass-selected population were genotyped using a 12k-SNP array. A total of 2,600 informative SNPs allowed to describe historical recombination, genetic diversity and genetic structure of this recently domesticated breeding pool that forms the basis of much of the current and future breeding of this species. We observe very low levels of population genetic structure and find no evidence that artificial selection has caused a reduction in genetic diversity. By combining these two pieces of information, we provided the map position of 1,671 SNPs corresponding to 1,192 different loci. This made it possible to analyze the spatial pattern of genetic diversity (H e ) and long distance linkage disequilibrium (LD) along the chromosomes. We found no particular pattern in the empirical variogram of H e across the 12 linkage groups and, as expected for an outcrossing species with large effective population size, we observed an almost complete lack of long distance LD. These results are a stepping stone for the development of strategies for studies in population genomics, association mapping and genomic prediction in this economical and ecologically important forest tree species.
- Published
- 2014
- Full Text
- View/download PDF
23. Invasion, démographie et évolution : le cas de l'hybridation
- Author
-
Bermond, Gérald, Institut Sophia Agrobiotech (ISA), Centre National de la Recherche Scientifique (CNRS)-Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Institut National de la Recherche Agronomique (INRA), Université Nice Sophia Antipolis, and Thomas Guillemaud
- Subjects
[SDV.SA]Life Sciences [q-bio]/Agricultural sciences ,contact secondaire ,microsatellites ,clines ,caractères d’histoire de vie ,introductions multiples ,admixture ,dispersion ,secondary contact ,déséquilibre de liaison ,dispersal ,hybridation ,linkage disequilibrium ,life history traits ,approximate bayesian computation - Abstract
This thesis deals with the invasion biology of the western corn rootworm, (WCR) in Europe. Multiple introductions of this pest in Europe from the United States and the 90’s, led to the formation of two main invasive outbreaks, genetically differentiated and located in Northwest Italy (NW Italy) and in Central and South-Eastern Europe (CSE Europe). Both outbreaks converged towards each other and came into contact in 2008, in the region of Veneto (Northern Italy). The main objective of these three years of research was to detect study and document a precise case of hybridization during a biological invasion. First of all, I showed that the contact zone detected in Veneto results in a hybrid zone. For that, several types of population genetics analyses were performed using microsatellite markers. In a second time, I exploited this hybrid zone and used the theory of neutral clines and the linkage disequilibrium to estimate dispersal (σ) of WCR in Northern Italy around 20 km.generation-1/2. Finally I showed the absence of impact of hybridization in the european invasion of WCR in natura, by measuring on hybrid and parental genotypes, numerous phenotypic traits positively associated to the fitness of individuals. Thus, a selection or a selection against hybrids is excluded in this particular case of hybridization and the invasion dynamics of WCR in Europe should not be affected in any way.; Cette thèse s’inscrit dans le contexte de la biologie de l’invasion de la chrysomèle des racines du maïs, Diabrotica virgifera virgifera (Dvv), en Europe. Les introductions multiples de cette peste sur le vieux continent à partir des années 1990 et en provenance des États-Unis ont conduit à la formation de plusieurs foyers envahissants dont deux principaux, différenciés génétiquement et situés en Italie du Nord-Ouest (Italie NO) et en Europe Centrale et du Sud-Est (Europe CSE). Ces deux foyers sont entrés en contact en 2008, en Italie du Nord, dans la région de la Vénétie. L’objectif principal de ces trois années de recherche était de détecter, d’étudier et de documenter un cas précis d’hybridation au cours d’une invasion biologique. Dans un premier temps, j'ai montré que la zone de contact détectée en Vénétie résultait bien en une zone hybride. Pour cela plusieurs types d’analyses de génétique des populations ont été réalisés à l’aide de marqueurs micro-satellites. Dans un second temps, j'ai exploité cette zone hybride et utilisé la théorie des clines neutres et le déséquilibre de liaison pour estimer la dispersion (σ) de Dvv en Italie du Nord aux alentours de 20 km.génération−1/2. Enfin j'ai montré l’absence d'impact de l’hybridation au cours de l’invasion européenne de Dvv in natura, en mesurant sur des génotypes hybrides et parentaux, de nombreux traits phénotypiques positivement liés à la fitness des individus. Ainsi, une sélection ou contre sélection des hybrides est à exclure dans ce cas précis d’hybridation et la dynamique de l’invasion de cette peste en Europe ne devrait être affectée en aucune façon.
- Published
- 2013
24. Invasion, demography and evolution : the case of hybridization
- Author
-
Bermond, Gérald, Institut Sophia Agrobiotech [Sophia Antipolis] (ISA), Institut National de la Recherche Agronomique (INRA)-Université Nice Sophia Antipolis (... - 2019) (UNS), Université Côte d'Azur (UCA)-Université Côte d'Azur (UCA)-Centre National de la Recherche Scientifique (CNRS), Université Nice Sophia Antipolis, Thomas Guillemaud, Institut Sophia Agrobiotech [Sophia Antipolis] ( ISA ), Centre National de la Recherche Scientifique ( CNRS ) -Université Nice Sophia Antipolis ( UNS ), Université Côte d'Azur ( UCA ) -Université Côte d'Azur ( UCA ) -Institut National de la Recherche Agronomique ( INRA ), Institut Sophia Agrobiotech (ISA), Centre National de la Recherche Scientifique (CNRS)-Université Nice Sophia Antipolis (... - 2019) (UNS), and COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Institut National de la Recherche Agronomique (INRA)
- Subjects
[SDV.SA]Life Sciences [q-bio]/Agricultural sciences ,Traits d'histoire de vie ,Contact secondaire ,Hybridation ,Dispersal ,Life history traits ,Clines ,Introductions multiples ,Dispersion ,Déséquilibre de liaison ,Multiples introductions ,Approximate Bayesian Computation ,Linkage disequilibrium ,Microsatellites ,[ SDV.SA ] Life Sciences [q-bio]/Agricultural sciences ,Hybridization ,Secondary contact - Abstract
This thesis deals with the invasion biology of the western corn rootworm, (WCR) in Europe. Multiple introductions of this pest in Europe from the United States and the 90’s, led to the formation of two main invasive outbreaks, genetically differentiated and located in Northwest Italy (NW Italy) and in Central and South-Eastern Europe (CSE Europe). Both outbreaks converged towards each other and came into contact in 2008, in the region of Veneto (Northern Italy). The main objective of these three years of research was to detect study and document a precise case of hybridization during a biological invasion. First of all, I showed that the contact zone detected in Veneto results in a hybrid zone. For that, several types of population genetics analyses were performed using microsatellite markers. In a second time, I exploited this hybrid zone and used the theory of neutral clines and the linkage disequilibrium to estimate dispersal (σ) of WCR in Northern Italy around 20 km.generation-1/2. Finally I showed the absence of impact of hybridization in the european invasion of WCR in natura, by measuring on hybrid and parental genotypes, numerous phenotypic traits positively associated to the fitness of individuals. Thus, a selection or a selection against hybrids is excluded in this particular case of hybridization and the invasion dynamics of WCR in Europe should not be affected in any way.; Cette thèse s’inscrit dans le contexte de la biologie de l’invasion de la chrysomèle des racines du maïs, Diabrotica virgifera virgifera (Dvv), en Europe. Les introductions multiples de cette peste sur le vieux continent à partir des années 1990 et en provenance des États-Unis ont conduit à la formation de plusieurs foyers envahissants dont deux principaux, différenciés génétiquement et situés en Italie du Nord-Ouest (Italie NO) et en Europe Centrale et du Sud-Est (Europe CSE). Ces deux foyers sont entrés en contact en 2008, en Italie du Nord, dans la région de la Vénétie. L’objectif principal de ces trois années de recherche était de détecter, d’étudier et de documenter un cas précis d’hybridation au cours d’une invasion biologique. Dans un premier temps, j'ai montré que la zone de contact détectée en Vénétie résultait bien en une zone hybride. Pour cela plusieurs types d’analyses de génétique des populations ont été réalisés à l’aide de marqueurs micro-satellites. Dans un second temps, j'ai exploité cette zone hybride et utilisé la théorie des clines neutres et le déséquilibre de liaison pour estimer la dispersion (σ) de Dvv en Italie du Nord aux alentours de 20 km.génération−1/2. Enfin j'ai montré l’absence d'impact de l’hybridation au cours de l’invasion européenne de Dvv in natura, en mesurant sur des génotypes hybrides et parentaux, de nombreux traits phénotypiques positivement liés à la fitness des individus. Ainsi, une sélection ou contre sélection des hybrides est à exclure dans ce cas précis d’hybridation et la dynamique de l’invasion de cette peste en Europe ne devrait être affectée en aucune façon.
- Published
- 2013
25. Impact du choix de la méthode de prédiction d'identité d'allèles à des loci sur la précision en cartographie de QTL
- Author
-
Jacquin, Laval, Elsen, Jean Michel, Gilbert, Hélène, Station d'Amélioration Génétique des Animaux (SAGA), and Institut National de la Recherche Agronomique (INRA)
- Subjects
haplotype ,prédicteur d'identité allélique ,déséquilibre de liaison ,distance matricielle ,[SDV]Life Sciences [q-bio] ,ComputingMilieux_MISCELLANEOUS - Abstract
National audience
- Published
- 2013
26. La cartographie des sites de régulation génétique à partir de données de débalancement allélique
- Author
-
Vello, Emilio D. and Labuda, Damian
- Subjects
LD ,AI ,Déséquilibre de Liaison ,Regulatory Region ,Linkage disequilibrium ,SNP ,Allelic imbalance ,eQTL ,Région régulatrice ,Regulation - Abstract
En 1975, Wilson et King ont proposé que l'évolution opère non seulement via des changements affectant la structure des protéines, mais aussi via des mutations qui modifient la régulation génétique. L'étude des éléments régulateurs de l'expression génétique a un rôle important dans la compréhension de l'expression de différentes maladies et de la réponse thérapeutique. Nous avons développé un algorithme bio- informatique qui nous permet rapidement de trouver des sites de régulation génétique à travers tout le génome et pour une grande quantité de gènes. Notre approche consiste à trouver des sites polymorphes (SNPs) qui sont en déséquilibre de liaison avec le débalancement allélique (AI) afin de cartographier la région régulatrice et le site responsable. Notre méthode est avantageuse par rapport à d'autres méthodes, car elle n'a pas besoin des données « phasées». De plus, les données de débalancement allélique ne sont pas affectées par des facteurs externes étant donné qu'ils sont mesurés dans la même cellule. Nous avons démontré que notre approche est fiable et qu'elle peut détecter des sites loin du gène. De plus, il peut être appliqué à des données de génotypage sans avoir besoin de les « phaser » ., Wilson and King (1975) proposed that evolution frequently operates through mutations affecting genetic regulation. Likewise, it is expected that genetic variation responsible for inter-individual differences will be due to variation in regulatory sites. Identifying such sites is thus important in the genetic and medical research. We have developed a new bioinformatics algorithm to find genome-wide regulatory sites for a big number of genes. Individuals carrying different alleles at a regulatory site will exhibit allelic imbalance(AI) due to differential expression of the two copies the same locus. Our approach consists of searching polymorphic sites (SNPs) in linkage disequilibrium with AI in order to map regulatory regions. We have detected many SNPs associated to the regulation of different genes pointed in previous studies. We have also found regulatory regions far from the transcription start site (TSS). The major advantage of this method is that phased data is not needed. In addition, AI data has the benefit of not being affected by external factors since it is measured in the same cell. The results show that our approach is reliable and it can detect sites far from the gene.
- Published
- 2012
27. Genome-wide linkage disequilibrium modeling using hierarchical latent Bayesian networks and applications
- Author
-
Mourad, Raphaël, Laboratoire d'Informatique de Nantes Atlantique (LINA), Mines Nantes (Mines Nantes)-Université de Nantes (UN)-Centre National de la Recherche Scientifique (CNRS), Université de Nantes, Philippe Leray(philippe.leray@univ-nantes.fr), and Projet Bioinformatique Ligérienne (BIL)
- Subjects
Bayesian networks ,[SDV]Life Sciences [q-bio] ,Machine learning ,Linkage disequilibrium ,Génétique d'association pangénomique ,Apprentissage automatique ,Genome-wide association studies ,Réseaux bayésiens ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,Déséquilibre de liaison - Abstract
Recent high-throughput genomic technologies opened the way for association studies aiming at the genome-wide characterization of genetic factors involved in complex genetic diseases, such as asthma and diabetes. In these studies, linkage disequilibrium (LD) reflects the existence of complex dependences in genetic data and plays a central role, since it ensures a precise localization of genetic factors. Nevertheless, the high complexity of LD, as well as the large dimension of genetic data, represents strong difficulties to consider. Research works of this PhD were carried out in this context. The contribution of research works presented here is twofold, since it is both theoretical and applied. On the theoretical side, we proposed a new approach of LD modeling. It is based on the development of a model coming from artificial intelligence and machine learning, the forest of hierarchical latent class models (FHLCM). The most significant contributions introduced are the ability of taking into account the fuzzy nature of LD and organizing into a hierarchy the multiple LD degrees. A novel scalable learning algorithm, named CFHLC, was developed in two versions: the first requires to split genome into contiguous windows to resolve the scalability issue, and the second (CFHLC+), more recent and advanced, implements a sliding window on chromosome. Using a real dataset, the comparison of the CFHLC method with others revealed that the former offers a more accurate modeling of LD. Besides, learning on data showing varying LD patterns showed the ability of FHLCM to faithfully reproduce the LD structure. Finally, the empirical analysis of learning complexity showed linearity in time when the number of variables to process increases. On the applied side, we explored two research avenues: causal discovery and global and intuitive visualization of LD. On the one hand, a systematic study of the ability of FHLCM for causal discovery is illustrated in the context of genetic association. This work established the basis of the development of novel methods for causal genetic factor identification in genome-wide association studies. On the other hand, a method was developed for the global and intuitive visualization of LD into three main contexts that geneticist can meet: visualization of short-range, long-range and genome-wide LD. This new method brings several assets as follows: (i) both pairwise LD (two variables) and multilocus LD (more than two variables) are simultaneously displayed, (ii) short-range and long-range LD are easily distinguished, and (iii) information is summarized in a hierarchical manner.; Les récentes technologies génomiques à haut-débit ont ouvert la voie aux études d'association visant la caractérisation systématique à l'échelle du génome des facteurs génétiques impliqués dans l'apparition des maladies génétiques complexes, telles que l'asthme et le diabète. Dans ces études, le déséquilibre de liaison (linkage disequilibrium, LD) reflète l'existence de dépendances complexes au sein des données génétiques et joue un rôle central, puisqu'il permet une localisation précise des facteurs génétiques. Néanmoins, la haute complexité du LD, ainsi que la dimension élevée des données génétiques, constituent autant de difficultés à prendre en compte. Les travaux de recherche réalisés au cours de cette thèse se sont placés dans cette perspective. La contribution des travaux de recherche présentés est double, puisqu'elle est à la fois théorique et appliquée. Sur le plan théorique, nous avons proposé une nouvelle approche de modélisation du LD. Elle est basée sur le développement d'un modèle issu du domaine de l'intelligence artificielle et de l'apprentissage automatique, la forêt de modèles hiérarchiques à classes latentes (FMHCL). Les nouveautés les plus significatives introduites sont la possibilité de prendre en compte la nature floue du LD et de hiérarchiser les différents degrés de LD. Un nouvel algorithme d'apprentissage supportant le passage à l'échelle, nommé CFHLC, a été développé et décliné en deux versions: la première nécessitant le découpage du génome en fenêtres contiguës pour résoudre le problème de passage à l'échelle, et la seconde (CFHLC+), plus récente et évoluée, résolvant le problème au moyen d'une fenêtre glissante sur le chromosome. A l'aide d'un jeu de données réelles, la comparaison de la méthode CFHLC avec des méthodes concurrentes a montré qu'elle offre une modélisation plus fine du LD. En outre, l'apprentissage sur des données présentant des patrons de LD variés a démontré la capacité de la FMHCL a reproduire fidèlement la structure du LD. Enfin, l'analyse empirique de la complexité de l'apprentissage a montré la linéarité en temps lorsque le nombre de variables à traiter augmente. Sur le plan appliqué, nous avons exploré deux pistes de recherche: la recherche de causalités et la visualisation synthétique et intuitive du LD. D'une part, une étude systématique de la capacité des FMHCL à la recherche de causalités est illustrée dans le contexte de la génétique d'association. Ce travail a établi les bases du développement de nouvelles méthodes de recherche dédiées à la découverte de facteurs génétiques causaux pour les études d'association à l'échelle du génome. D'autre part, une méthode a été développée pour la visualisation synthétique et intuitive du LD adaptée aux trois principales situations que peut rencontrer le généticien: la visualisation du LD de courte distance, de longue distance et dans un contexte pangénomique. Cette nouvelle méthode apporte des atouts majeurs qui sont les suivants: (i) le LD par paires (deux variables) et le LD multilocus (deux variables ou plus) sont simultanément visualisés, (ii) le LD de courte distance et le LD de longue distance sont facilement distingués, et (iii) l'information est synthétisée de manière hiérarchique.
- Published
- 2011
28. Modélisation pangénomique du déséquilibre de liaison à l'aide de réseaux bayésiens hiérarchiques latents et applications
- Author
-
Mourad, Raphaël, Laboratoire d'Informatique de Nantes Atlantique (LINA), Centre National de la Recherche Scientifique (CNRS)-Mines Nantes (Mines Nantes)-Université de Nantes (UN), Université de Nantes, Philippe Leray(philippe.leray@univ-nantes.fr), and Projet Bioinformatique Ligérienne (BIL)
- Subjects
Bayesian networks ,[SDV]Life Sciences [q-bio] ,Machine learning ,Linkage disequilibrium ,Génétique d'association pangénomique ,Apprentissage automatique ,Genome-wide association studies ,Réseaux bayésiens ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,Déséquilibre de liaison - Abstract
Recent high-throughput genomic technologies opened the way for association studies aiming at the genome-wide characterization of genetic factors involved in complex genetic diseases, such as asthma and diabetes. In these studies, linkage disequilibrium (LD) reflects the existence of complex dependences in genetic data and plays a central role, since it ensures a precise localization of genetic factors. Nevertheless, the high complexity of LD, as well as the large dimension of genetic data, represents strong difficulties to consider. Research works of this PhD were carried out in this context. The contribution of research works presented here is twofold, since it is both theoretical and applied. On the theoretical side, we proposed a new approach of LD modeling. It is based on the development of a model coming from artificial intelligence and machine learning, the forest of hierarchical latent class models (FHLCM). The most significant contributions introduced are the ability of taking into account the fuzzy nature of LD and organizing into a hierarchy the multiple LD degrees. A novel scalable learning algorithm, named CFHLC, was developed in two versions: the first requires to split genome into contiguous windows to resolve the scalability issue, and the second (CFHLC+), more recent and advanced, implements a sliding window on chromosome. Using a real dataset, the comparison of the CFHLC method with others revealed that the former offers a more accurate modeling of LD. Besides, learning on data showing varying LD patterns showed the ability of FHLCM to faithfully reproduce the LD structure. Finally, the empirical analysis of learning complexity showed linearity in time when the number of variables to process increases. On the applied side, we explored two research avenues: causal discovery and global and intuitive visualization of LD. On the one hand, a systematic study of the ability of FHLCM for causal discovery is illustrated in the context of genetic association. This work established the basis of the development of novel methods for causal genetic factor identification in genome-wide association studies. On the other hand, a method was developed for the global and intuitive visualization of LD into three main contexts that geneticist can meet: visualization of short-range, long-range and genome-wide LD. This new method brings several assets as follows: (i) both pairwise LD (two variables) and multilocus LD (more than two variables) are simultaneously displayed, (ii) short-range and long-range LD are easily distinguished, and (iii) information is summarized in a hierarchical manner.; Les récentes technologies génomiques à haut-débit ont ouvert la voie aux études d'association visant la caractérisation systématique à l'échelle du génome des facteurs génétiques impliqués dans l'apparition des maladies génétiques complexes, telles que l'asthme et le diabète. Dans ces études, le déséquilibre de liaison (linkage disequilibrium, LD) reflète l'existence de dépendances complexes au sein des données génétiques et joue un rôle central, puisqu'il permet une localisation précise des facteurs génétiques. Néanmoins, la haute complexité du LD, ainsi que la dimension élevée des données génétiques, constituent autant de difficultés à prendre en compte. Les travaux de recherche réalisés au cours de cette thèse se sont placés dans cette perspective. La contribution des travaux de recherche présentés est double, puisqu'elle est à la fois théorique et appliquée. Sur le plan théorique, nous avons proposé une nouvelle approche de modélisation du LD. Elle est basée sur le développement d'un modèle issu du domaine de l'intelligence artificielle et de l'apprentissage automatique, la forêt de modèles hiérarchiques à classes latentes (FMHCL). Les nouveautés les plus significatives introduites sont la possibilité de prendre en compte la nature floue du LD et de hiérarchiser les différents degrés de LD. Un nouvel algorithme d'apprentissage supportant le passage à l'échelle, nommé CFHLC, a été développé et décliné en deux versions: la première nécessitant le découpage du génome en fenêtres contiguës pour résoudre le problème de passage à l'échelle, et la seconde (CFHLC+), plus récente et évoluée, résolvant le problème au moyen d'une fenêtre glissante sur le chromosome. A l'aide d'un jeu de données réelles, la comparaison de la méthode CFHLC avec des méthodes concurrentes a montré qu'elle offre une modélisation plus fine du LD. En outre, l'apprentissage sur des données présentant des patrons de LD variés a démontré la capacité de la FMHCL a reproduire fidèlement la structure du LD. Enfin, l'analyse empirique de la complexité de l'apprentissage a montré la linéarité en temps lorsque le nombre de variables à traiter augmente. Sur le plan appliqué, nous avons exploré deux pistes de recherche: la recherche de causalités et la visualisation synthétique et intuitive du LD. D'une part, une étude systématique de la capacité des FMHCL à la recherche de causalités est illustrée dans le contexte de la génétique d'association. Ce travail a établi les bases du développement de nouvelles méthodes de recherche dédiées à la découverte de facteurs génétiques causaux pour les études d'association à l'échelle du génome. D'autre part, une méthode a été développée pour la visualisation synthétique et intuitive du LD adaptée aux trois principales situations que peut rencontrer le généticien: la visualisation du LD de courte distance, de longue distance et dans un contexte pangénomique. Cette nouvelle méthode apporte des atouts majeurs qui sont les suivants: (i) le LD par paires (deux variables) et le LD multilocus (deux variables ou plus) sont simultanément visualisés, (ii) le LD de courte distance et le LD de longue distance sont facilement distingués, et (iii) l'information est synthétisée de manière hiérarchique.
- Published
- 2011
29. Haplotype tagging efficiency and tagSNP sets portability in worldwide populations in NAT2 gene
- Author
-
Sabbagh, Audrey, Darlu, Pierre, Langaney, André, and Poloni, Estella S.
- Subjects
association studies ,génétique des populations ,population genetics ,haplotype tagging ,déséquilibre de liaison ,études d’association ,NAT2 ,linkage disequilibrium ,ddc:599.9 ,marquage haplotypique - Abstract
Genetic polymorphism in the NAT2 gene is responsible for pronounced interindividual differences in the acetylation activity of the N-acetyltransferase 2 (NAT2) enzyme, which plays a crucial role in the metabolism of many clinically useful drugs and exogenous chemicals. Up to now, most association studies that have attempted to relate the acetylation phenotype in NAT2 to a variety of complex human disorders have led to contradictory results in different populations. Some of these inconsistencies may result from a poor knowledge of linkage patterns at NAT2 and their geographic variation. Using data from an extensive survey of the literature, we investigated the worldwide haplotype diversity and linkage disequilibrium structure of NAT2. For 28 population samples (including 3,994 individuals) from four continental regions (Africa, Europe, Asia, America), we evaluated haplotype tagging efficiency at NAT2 and defined population-specific sets of haplotype tagging SNPs (htSNPs) to be used for future association studies. Tagging common haplotypes yielded 2- to 3-fold savings in European and East Asian samples, while no gains from tagging were observed in samples of African ancestry, which displayed high haplotype diversity at NAT2. htSNPs sets appeared to be portable among populations from a same continent, provided that the continent-specific htSNPs sets were selected with a stringent criterion. A “cosmopolitan” htSNPs set suitable for all human populations could not be identified for the NAT2 gene, but a single four-htSNP set proved to perform successfully in all the non-African populations investigated. Le polymorphisme génétique du gène NAT2 est responsable de fortes différences interindividuelles de l’activité d’acétylation de l’enzyme N-acetyltransférase 2 (NAT2). Cette enzyme joue un rôle fondamental dans le métabolisme de nombreux xénobiotiques et médicaments utilisés en clinique. Jusqu’à présent, la plupart des études d’association qui ont tenté de relier les phénotypes d’acétylation du gène NAT2 à plusieurs maladies complexes chez l’homme ont conduit à des résultats contradictoires, essentiellement en raison des faibles connaissances sur la variation géographique des profils de déséquilibre de liaison au locus NAT2. C’est pourquoi nous avons entrepris une étude exhaustive de la littérature relatant la diversité mondiale haplotypique du gène NAT2 et décrivant les déséquilibres de liaison entre différents SNP (Single Nucleotide Polymorphism) de ce gène. Notre échantillon comprend 28 populations (incluant 3994 individus) réparties sur quatre continents (Afrique, Europe, Asie, Amérique). Pour chacune d’elles, nous avons estimé l’efficacité du marquage haplotypique (tagging) et défini le sous-ensemble de SNP (htSNP) qui s’avère juste nécessaire pour réaliser efficacement des études d’association. Ce marquage haplotypique permet de réduire d’un facteur 2 à 3 fois le nombre de SNP à étudier, du moins pour les populations d’Europe et d’Asie de l’Est. En revanche, la diversité haplotypique en Afrique est telle qu’aucune réduction n’est possible pour ce continent. Les marqueurs htSNP sélectionnés dans une population restent performants pour le continent dans lequel elle se situe, à la condition que les htSNP aient été sélectionnés avec un critère suffisamment « stringent ». Pour ce gène NAT2, il n’est pas possible d’identifier un unique ensemble de htSNP qui serait « universel » et efficace pour toutes les populations ; mais un ensemble réduit à seulement quatre htSNP reste parfaitement efficace dans le cas des populations non africaines.
- Published
- 2011
30. Recherche de marqueurs génétiques associés à la tolérance et/ou sensibilité des bovins aux trypanosomoses africaines
- Author
-
Dayo, Guiguigbaza-Kossigan
- Subjects
SELECTION ,DESEQUILIBRE DE LIAISON ,DIVERSITE GENETIQUE ,PHENOTYPE ,BOVIN ,GENETIQUE DE POPULATION ,MARQUEUR MICROSATELLITE ,CROISEMENT ,SENSIBILITE RESISTANCE ,LOCUS ,POLYMORPHISME GENETIQUE ,QTL.QUANTITATIVE TRAIT LOCUS ,TOLERANCE ,ZEBU ,TRYPANOSOMIASE ANIMALE ,IMMUNITE - Published
- 2009
31. Diversity of genetic resistance to South American Leaf Blight of rubber tree (Microcyclus ulei) assessed by QTL mapping and association genetics within natural populations
- Author
-
Le Guen, Vincent, Développement et amélioration des plantes (UMR DAP), Centre National de la Recherche Scientifique (CNRS)-Université Montpellier 2 - Sciences et Techniques (UM2)-Institut National de la Recherche Agronomique (INRA)-Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad), Université Montpellier II - Sciences et Techniques du Languedoc, and Brigitte Courtois
- Subjects
Résistance génétique ,Locus des caractères quantitatifs ,QTL ,Microcyclus ulei ,cartographie génétique ,microsatellites ,F30 - Génétique et amélioration des plantes ,Variation génétique ,Génétique des populations ,structure des populations ,génétique d'association ,[SDV.BV]Life Sciences [q-bio]/Vegetal Biology ,déséquilibre de liaison ,H20 - Maladies des plantes ,Hevea brasiliensis ,SALB ,Carte génétique - Abstract
South American Leaf Blight (SALB) caused by the fungus Microcyclus ulei is a serious threat to worldwide rubber tree cultivation and also responsible for the poor development of this culture in South and Central America. The breeding of resistant cultivars is considered as the best way to anticipate an accidental introduction of SALB in disease free countries and to develop rubber tree cultivation in diseased areas. The main resistance source described until now proved to be ineffective against the most aggressive fungus isolates. Another resistance source identified in a Peruvian cultivar holds for more than thirty years in high infestation conditions. Genetic mapping carried out on the progeny of a cross between this cultivar and a susceptible one revealed two major resistance genes, one located on linkage group g15 and effective against M. ulei isolates from French Guiana, and the other one on linkage group g13 effective against isolates from Bahia state (Brazil). Diversity analysis in South-West Amazonian natural populations shows populations structured in three main clusters corresponding to the Brazilian states of Acre, Rondônia and Mato Grosso. The Madre de Dios population in Peru is part of the Acre genetic cluster. Differentiation among populations is mainly explained by isolation by distance and secondarily by the existence of hydrographical basins. The linkage disequilibrium between linked neutral genetic markers is wider in Acre cluster than in Rondônia cluster, but remains low in both cases. A genetic association with the SALB resistant trait is detected with a microsatellite marker located close to the major resistance gene in linkage group g15. Another association is also detected in a genomic area where no resistant locus was expected until now. Importance of these results for breeding of new SALB resistant cultivars is discussed.; Menace potentielle pour l'hévéaculture mondiale, la maladie sud-américaine des feuilles de l'hévéa provoquée par le champignon Microcyclus ulei est aussi responsable du faible développement de cette culture en Amérique latine. La sélection de variétés résistantes est privilégiée pour anticiper une apparition accidentelle de la maladie dans les pays encore épargnés et pour développer la culture de l'hévéa dans les zones infestées. La principale source de résistance décrite jusqu'à présent n'est pas fonctionnelle face à des isolats très agressifs du champignon. Une autre source de résistance identifiée chez un cultivar originaire du Pérou se maintient depuis plus de trente ans en conditions de forte infestation. La cartographie génétique réalisée sur la descendance de ce cultivar en croisement révèle l'existence de deux gènes majeurs de résistance, l'un situé sur le groupe de liaison g15 et efficace contre les isolats de Guyane et l'autre sur le groupe de liaison g13 efficace vis-à-vis des isolats de l'état de Bahia. L'analyse de la diversité des populations naturelles du sud-ouest Amazonien fait apparaître une structure en trois groupes principaux recouvrant les états brésiliens de l'Acre, du Rondônia et du Mato Grosso. La population Madre de Dios au Pérou est rattachée au groupe de l'Acre. La différentiation entre les populations est expliquée principalement par l'isolement par la distance et secondairement par l'existence de bassins hydrographiques. Le déséquilibre de liaison entre marqueurs liés est plus étendu dans le groupe Acre que dans le groupe Rondônia, mais reste faible dans les deux cas. Une association avec le caractère de résistance à M. ulei est détectée avec un marqueur microsatellite situé à proximité du gène majeur de résistance du groupe de liaison g15. Une autre association est détectée dans une portion du génome où aucun locus de résistance n'était identifié jusqu'à présent. L'importance de ces résultats pour la sélection de nouveaux cultivars résistants à M. ulei est discutée.
- Published
- 2008
32. Structuration de la diversité génétique et analyse des patrons de déséquilibre de liaison de l'espèce Coffea canephora Pierre ex. Froehner
- Author
-
Cubry, Philippe, Développement et amélioration des plantes (UMR DAP), Centre National de la Recherche Scientifique (CNRS)-Université Montpellier 2 - Sciences et Techniques (UM2)-Institut National de la Recherche Agronomique (INRA)-Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad), Université Montpellier II - Sciences et Techniques du Languedoc, and Thierry Leroy(thierry.leroy@cirad.fr)
- Subjects
[SDV.EE]Life Sciences [q-bio]/Ecology, environment ,structure génétique ,Coffea canephora Pierre ,association studies ,diversité génétique ,genetic structure ,population genetics ,génétique des populations ,genetic diversity ,déséquilibre de liaison ,linkage disequilibrium ,études d'association - Abstract
The search for associations between molecular markers and variation of traits with agronomic importance is a main goal of Marker-Assisted Selection development, especially for perennials species. Knowledge of genetic diversity and structure is a prerequisite for such studies. In the same way, knowledge of structure and extant of Linkage Disequilibrium in populations is an important task. We strengthen and fine-tuned previously described genetic structure and diversity of Coffea canephora Pierre in order to assess the capabilities of association mapping based approaches for this species. We laid the basis for rapid characterization of genetic resources with the help of microsatellite markers and clarify the genetic origin of a previously nonstudied population. Future development of core-collections will benefit from these results. Structure and extent of Linkage Disequilibrium was determined at different scales and for different populations or genetic groups, with the help of 108 genome wide markers, giving the opportunities to identify suitable populations for the 2 assocation mapping categories, genome-wide scan and candidate region. A first try of association mapping confirms the important capabilities of such approaches for our species. Implications of genetic diversity and structure as well as Linkage Disequilibrium structure for future breeding purposes are discussed; La recherche d'associations entre marqueurs moléculaires et les variations de caractères d'intérêt agronomique est un enjeu majeur du développement de la sélection assistée par marqueurs, notamment pour des espèces pérennes. La connaissance de la diversité génétique et de la structure de celle-ci est un préalable indispensable à la mise en place de telles études. Au même titre, la connaissance de l'étendue et de l'intensité du déséquilibre de liaison au sein des populations considérées est également nécessaire. Nous avons donc entrepris de confirmer et de préciser la diversité et la structure génétique de Coffea canephora Pierre afin d'évaluer les potentialités d'études d'association sur cette espèce. Nous avons posé les bases d'une caractérisation rapide des collections de ressources génétiques de cette espèce à l'aide de marqueurs microsatellites et précisé l'origine génétique d'une population jusqu'à présent non étudiée. Cette base pourra également servir au développement de futures cores-collections. L'évaluation de la structure et de l'étendue du déséquilibre de liaison à différentes échelles et au niveau de différentes populations ou groupes de diversité à l'aide de 108 marqueurs répartis sur l'ensemble du génome nous a permis de proposer des populations utilisables pour les 2 types d'approches de génétique d'associations, scan génome entier ou région candidate. Un premier essai d'étude d'association a montré les potentialités importantes de ces approches pour notre espèce. Les implications de l'importance de la diversité génétique et de sa structure ainsi que de la structure du déséquilibre de liaison au sein de nos populations pour l'amélioration sont discutées.
- Published
- 2008
33. Genetic bases of drought resistance in rice: From QTLs to genes to alleles
- Author
-
Courtois, Brigitte, Développement et amélioration des plantes (UMR DAP), Centre National de la Recherche Scientifique (CNRS)-Université Montpellier 2 - Sciences et Techniques (UM2)-Institut National de la Recherche Agronomique (INRA)-Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad), Université Montpellier II - Sciences et Techniques du Languedoc, and Francis QUETIER (Professeur, Université d'Evry)
- Subjects
Asia ,clonage positionnel ,méta-QTLs ,drought resistance ,variabilité allélique ,Asie ,positional cloning ,Oryza sativa ,meta-QTL analysis ,marker-aided selection ,allelic variation ,QTLs ,riz pluvial ,résistance à la sécheresse ,upland rice ,plant breeding ,[SDV.BV]Life Sciences [q-bio]/Vegetal Biology ,root system ,déséquilibre de liaison ,linkage disequilibrium association mapping ,étude d'association ,racines ,amélioration des plantes ,sélection assistée par marqueurs - Abstract
Deux document disponibles:- HDR elle-même- Document annexe sur l'amélioration génétique du riz auquel il est fait référence dans l'HDR; L'objectif scientifique de mon travail de recherche et d'encadrement d'étudiants a principalement concerné la détermination des bases génétiques de la résistance à la sécheresse du riz. Une partie de ces travaux ont été menés à l'Institut International de Recherche sur le Riz aux Philippines, dans le cadre d'un programme de sélection du riz pluvial pour l'Asie du Sud et du Sud-Est. Le riz pluvial ne dépend que la pluviométrie pour son alimentation hydrique et souffre donc de déficits hydriques fréquents. La nature des sécheresses rencontrées dans les environnements cibles m'ont conduite à travailler plus particulièrement sur la morphologie du système racinaire et sur l'ajustement osmotique. L'approche choisie a été celle de la génétique moléculaire. Les travaux conduits ont permis des progrès dans la compréhension du déterminisme génétique de ces caractères et la localisation de QTL d'intérêt dans des populations de cartographie classique, puis des populations de back-cross avancés, plus adaptées à un programme de sélection. Des lignées quasi isogéniques introgressées avec des QTLs de profondeur racinaire ont été produites par sélection assistée par marqueurs et utilisées pour valider l'existence et l'effet des QTLs. Mon projet de recherche actuel conduit à Montpellier dans l'UMR "Développement et Amélioration des Plantes" se situe dans la continuité des travaux précédents. Il consiste à relier les nombreux QTL de morphologie racinaire identifiés à ce jour chez le riz aux gènes sous jacents, puis à analyser la variabilité allélique de ces gènes dans différents fonds génétiques. Plusieurs approches complémentaires seront utilisées pour réaliser la cartographie fine des QTLs. La large gamme de données disponibles va d'abord être utilisée pour affiner la position des QTLs par une approche statistique de méta-analyse. L'approche d'étude d'association a également été retenue ce qui suppose, en préalable, de clarifier l'étendue du déséquilibre de liaison chez le riz. Des approches au niveau du génome entier seront suivies d'approches ciblées sur des gènes candidats, en ayant largement recours aux données de séquençage total du génome de 2 variétés de riz et de séquençage partiel de 20 autres. Enfin, en utilisant les lignées quasi-isogéniques produites à l'IRRI, le clonage d'un QTL de profondeur racinaire a été entrepris. L'intégration de ces approches de génétique directe avec les approches complémentaires de génétique inverse utilisées par d'autres personne de l'équipe "Développement et adaptation du riz" se fera autour des gènes dont la fonction aura été validée. La combinaison des allèles les plus adaptés aux environnements cibles dans des variétés d'élite constituera le but ultime de mon travail.
- Published
- 2008
34. Bases génétiques de la résistance à la sécheresse chez le riz : des QTLs aux gènes et des gènes aux allèles
- Author
-
Courtois, Brigitte, Développement et amélioration des plantes (UMR DAP), Centre National de la Recherche Scientifique (CNRS)-Université Montpellier 2 - Sciences et Techniques (UM2)-Institut National de la Recherche Agronomique (INRA)-Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad), Université Montpellier II - Sciences et Techniques du Languedoc, and Francis QUETIER (Professeur, Université d'Evry)
- Subjects
Asia ,clonage positionnel ,méta-QTLs ,drought resistance ,variabilité allélique ,Asie ,positional cloning ,Oryza sativa ,meta-QTL analysis ,marker-aided selection ,allelic variation ,QTLs ,riz pluvial ,résistance à la sécheresse ,upland rice ,plant breeding ,[SDV.BV]Life Sciences [q-bio]/Vegetal Biology ,root system ,déséquilibre de liaison ,linkage disequilibrium association mapping ,étude d'association ,racines ,amélioration des plantes ,sélection assistée par marqueurs - Abstract
Deux document disponibles:- HDR elle-même- Document annexe sur l'amélioration génétique du riz auquel il est fait référence dans l'HDR; L'objectif scientifique de mon travail de recherche et d'encadrement d'étudiants a principalement concerné la détermination des bases génétiques de la résistance à la sécheresse du riz. Une partie de ces travaux ont été menés à l'Institut International de Recherche sur le Riz aux Philippines, dans le cadre d'un programme de sélection du riz pluvial pour l'Asie du Sud et du Sud-Est. Le riz pluvial ne dépend que la pluviométrie pour son alimentation hydrique et souffre donc de déficits hydriques fréquents. La nature des sécheresses rencontrées dans les environnements cibles m'ont conduite à travailler plus particulièrement sur la morphologie du système racinaire et sur l'ajustement osmotique. L'approche choisie a été celle de la génétique moléculaire. Les travaux conduits ont permis des progrès dans la compréhension du déterminisme génétique de ces caractères et la localisation de QTL d'intérêt dans des populations de cartographie classique, puis des populations de back-cross avancés, plus adaptées à un programme de sélection. Des lignées quasi isogéniques introgressées avec des QTLs de profondeur racinaire ont été produites par sélection assistée par marqueurs et utilisées pour valider l'existence et l'effet des QTLs. Mon projet de recherche actuel conduit à Montpellier dans l'UMR "Développement et Amélioration des Plantes" se situe dans la continuité des travaux précédents. Il consiste à relier les nombreux QTL de morphologie racinaire identifiés à ce jour chez le riz aux gènes sous jacents, puis à analyser la variabilité allélique de ces gènes dans différents fonds génétiques. Plusieurs approches complémentaires seront utilisées pour réaliser la cartographie fine des QTLs. La large gamme de données disponibles va d'abord être utilisée pour affiner la position des QTLs par une approche statistique de méta-analyse. L'approche d'étude d'association a également été retenue ce qui suppose, en préalable, de clarifier l'étendue du déséquilibre de liaison chez le riz. Des approches au niveau du génome entier seront suivies d'approches ciblées sur des gènes candidats, en ayant largement recours aux données de séquençage total du génome de 2 variétés de riz et de séquençage partiel de 20 autres. Enfin, en utilisant les lignées quasi-isogéniques produites à l'IRRI, le clonage d'un QTL de profondeur racinaire a été entrepris. L'intégration de ces approches de génétique directe avec les approches complémentaires de génétique inverse utilisées par d'autres personne de l'équipe "Développement et adaptation du riz" se fera autour des gènes dont la fonction aura été validée. La combinaison des allèles les plus adaptés aux environnements cibles dans des variétés d'élite constituera le but ultime de mon travail.
- Published
- 2008
35. Recherche de déterminants génomiques impliqués dans l'hypertension, sur le chromosome X, chez des familles du Saguenay-Lac-Saint-Jean
- Author
-
Noël, Audrey, Hamet, Pavel, and Merlo, Ettore
- Subjects
Association ,Chromosome X ,Gènes ,Liaison ,Hypertension ,Déséquilibre de liaison ,SNPs - Abstract
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal.
- Published
- 2008
36. Déséquilibre de liaison et cartographie de QTL en population sélectionnée
- Author
-
Ytournel, Florence, ProdInra, Migration, Station de Génétique Quantitative et Appliquée (SGQA), Institut National de la Recherche Agronomique (INRA), AgroParisTech, Inconnu Inconnu, and AgroParisTech, Ecole
- Subjects
[SDV] Life Sciences [q-bio] ,Identity by descent ,LINKAGE DISEQUILIBRIUM ,Haplotypes ,[SDV]Life Sciences [q-bio] ,QTL FINE MAPPING ,Genetic markers ,Marqueurs génétiques ,these ,Selection ,Déséquilibre de liaison ,CARTOGRAPHIE FINE DE QTL ,Identité par descendance - Abstract
Linkage disequilibrium (LD) is due to non random associations between alleles at two loci. It has become a classical tool to fine map loci implied in quantitative trait (Quantitative Trait Loci, QTL) determinism, through identification of the maxima of LD between alleles of a marker locus (or a group of marker loci) and a locus involved in the variability of a quantitative trait. The creation and intensity of LD evolves according to the evolutionary forces affecting the population. Among these forces, random drift and selection are particularly present in livestock populations. This PhD thesis aimed to study the influence of selection on the structure of LD around a QTL, as well as its impact on the precision on the fine mapping of QTL. A software has been developed to simulate the evolution of populations. Starting from a population in linkage equilibrium, LD due to evolutionary forces is created over historical generations. QTL detection is applied to the next generations where the pedigree is known. The main experimental designs applied in livestock populations are implemented in the software. All data used for the further analysis of this work were obtained from this simulation program. We first analyzed LD in the neighbourhood of the QTL by recording the location of the marker in maximum LD with the QTL. LD was estimated with two classical measures: D' and, Par définition le déséquilibre de liaison (Linkage Disequilibrium, LD) décrit les associations préférentielles entre allèles de deux locus. Ce concept est devenu un outil indispensable pour la cartographie fine de locus quantitatifs (QTL), par l'identification de déséquilibres d'associations entre allèles à un locus marqueur (ou à un ensemble de locus marqueurs) et à un locus impliqué dans la variation d'un caractère quantitatif. La création et l'intensité du LD sont dépendantes des forces évolutives qui ont construit la population. Parmi ces forces, la dérive génétique et la sélection sont particulièrement actives dans les populations d'animaux de rente. Cette thèse a pour but d'étudier l'influence de la sélection sur la structure du déséquilibre de liaison autour d'un locus quantitatif, ainsi que son impact sur la précision de cartographie fine des QTL. Un logiciel de simulation de populations a été développé dans le cadre de la thèse. A partir d'une population en équilibre de liaison, il permet de générer du LD dans des générations dites historiques, grâce à différentes forces évolutives. La détection de QTL est appliquée aux générations suivantes, de généalogie connue. Pour ces dernières générations, les principaux dispositifs de détection de QTL de génétique animale sont décrits dans le simulateur. Les données exploitées dans cette thèse sont issues de ce logiciel. Le LD a été mesuré par le D' et le
- Published
- 2008
37. PATRON DE POLYMORPHISME ET SIGNATURE MOLECULAIRE DE L'ADAPTATION AU MILIEU SALIN DE HELIANTHUS PARADOXUS
- Author
-
Edelist, Cécile, Génétique Quantitative et Evolution - Le Moulon (Génétique Végétale) (GQE-Le Moulon), Centre National de la Recherche Scientifique (CNRS)-AgroParisTech-Université Paris-Sud - Paris 11 (UP11)-Institut National de la Recherche Agronomique (INRA), Université Paris Sud - Paris XI, Christine Dillmann(dillmann@moulon.inra.fr), Collaboration avec le laboratoire de Loren Rieseberg (IU, Bloomington IN, USA et UBC, Vancouver, Canada), and Institut National de la Recherche Agronomique (INRA)-Université Paris-Sud - Paris 11 (UP11)-AgroParisTech-Centre National de la Recherche Scientifique (CNRS)
- Subjects
[SDV.EE]Life Sciences [q-bio]/Ecology, environment ,balayage sélectif ,homoploid hybrid ,expression génique ,stress salin ,adaptation ,hybridation homoploïde ,selective sweep ,Sunflower ,Tournesol ,spéciation ,gene expression ,Helianthus ,évolution ,déséquilibre de liaison ,linkage disequilibrium ,salt stress - Abstract
The homoploid hybrid sunflower species, Helianthus paradoxus, is derived from two wild sunflower species H. annuus and H. petiolaris, and is adapted to salt marshes. My thesis work characterized the genetic basis of the natural selection that created the adaptation of H. paradoxus to this extreme habitat.I searched for signatures of selection at the whole genome scale, as well as at a finer scale of 20 to 90 cM within individual chromosomes. Accordingly, I analyzed the genetic diversity of three natural populations of H. paradoxus and its parental species using microsatellite markers. For the analysis, I used microsatellite markers that are located near three survivorship QTLs, and compared their genetic diversity to markers from putative unselected regions. Genetic diversity was significantly lower around the survivorship QTL in the hybrid species but not in the parental species, signaling for the signature of selection in the H. paradoxus genome detectable at this scale. At the finer scale, I found a mosaic pattern of genetic diversity. To overcome unknown mapping locations of genetic markers in H. paradoxus, a method to group and order markers based on measure of linkage disequilibrium in natural populations was developed. Congruence of the order according to the sunflower genetic map and the linkage disequilibrium ordering depended on the populations and the genetic scale tested.In addition, a physiological and gene expression study was developed to understand the mechanisms of H. paradoxus adaptation to salty habitat. The hybrid species exhibited a high plasticity response, and performed better than its parental species in a saline habitat. Leaves of H. paradoxus were more succulent and have a higher concentration of sodium and sulfate, compared to the parental species. Several candidate genes, implied in various salinity response pathways and located for some within the mapped QTL regions, were differentially expressed in the hybrid species and the two parental species. These results confirm that these genes are potential candidate genes for studying H. paradoxus adaptation to saline marshes, and probably played a major role in the process of speciation.; Deux espèces sauvages de tournesols Helianthus annuus et H. petiolaris ont donné naissance il y a plusieurs milliers d'années à une espèce hybride H. paradoxus inféodée à des marais salins. Ma thèse a consisté à caractériser les bases génétiques de l'adaptation de H. paradoxus à ce milieu extrême.J'ai recherché des signatures de sélection à deux échelles : à l'échelle du génome et à une échelle plus fine comprise entre 20 et 90 cM. Pour cela j'ai analysé les patrons de diversité génétique pour des marqueurs microsatellites dans trois populations naturelles de H. paradoxus et des deux espèces parentales, autour de trois QTL de survie et ailleurs dans le génome. A l'échelle du génome, une baisse de diversité autour de ces QTL a été mise en évidence chez l'espèce hybride et non chez ses parents indiquant qu'il est possible de détecter une signature de la sélection à cette échelle chez cette espèce. A l'échelle plus fine, le patron de diversité est en mosaïque. L'ordre des marqueurs n'étant pas connu avec certitude chez l'espèce hybride, une méthode basée sur le déséquilibre de liaison entre des marqueurs génotypés dans des populations naturelles a été développée. Cette méthode permet de regrouper sur une carte des marqueurs en fort déséquilibre de liaison. La correspondance entre carte de déséquilibre de liaison et carte génétique varie selon les populations et l'échelle génétique.Parallèlement une étude physiologique et d'expression génique visant à comprendre le mécanisme d'adaptation à la salinité de H. paradoxus a été conduite. L'espèce hybride est très plastique, mais se porte mieux en milieu salin, ses feuilles sont plus succulentes, avec une concentration en sodium et sulfate très élevée dans ses tissus. Plusieurs gènes candidats, impliqués dans différentes voies de réponse à la salinité, et dont certains sont cartographiés dans les régions des QTL, sont différentiellement exprimés chez l'espèce hybride et chez ses parents. Ces résultats confirment qu'ils sont des candidats potentiels importants dans l'adaptation de H. paradoxus aux marais salins et donc impliqués dans le processus de spéciation.
- Published
- 2007
38. Extent of linkage disequilibrium in a large cattle population of Western Africa and consequences for association studies
- Author
-
Thevenon, S., Dayo, Guiguigbaza-Kossigan, Sylla, S., Sidibé, Issa, Berthier, Daphné, LEGROS, Hortense, Boichard, Didier, Eggen, Andre, Gautier, Mathieu, Station de Génétique Quantitative et Appliquée (SGQA), Institut National de la Recherche Agronomique (INRA), and Unité de recherche Génétique Biochimique et Cytogénétique (LGBC)
- Subjects
EFFECTIVE POPULATION SIZE ,microsatellite ,LINKAGE DISEQUILIBRIUM ,bovin ,effectif efficace ,[SDV]Life Sciences [q-bio] ,CATTLE ,MICROSATELLITE ,déséquilibre de liaison ,ComputingMilieux_MISCELLANEOUS - Abstract
International audience
- Published
- 2007
39. Linkage disequilibrium in synthetic varieties of Lolium perenne L
- Author
-
Auzanneau, Jerome, Cameleyre, Isabelle, Huyghe, Christian, Julier, Bernadette, Barre, Philippe, Unité de recherche Génétique et Amélioration des Plantes Fourragères (UGAPF), Institut National de la Recherche Agronomique (INRA), and ProdInra, Migration
- Subjects
[SDV] Life Sciences [q-bio] ,LINKAGE DISEQUILIBRIUM ,RAY GRASS ANGLAIS ,SYNTHETIC VARIETY ,[SDV]Life Sciences [q-bio] ,DESEQUILIBRE DE LIAISON ,GENETIQUE VEGETALE ,BIOLOGIE MOLECULAIRE - Published
- 2006
40. Single-nucleotide polymorphism frequency in a set of selected lines of bread wheat (Triticum aestivum L.)
- Author
-
Sébastien Praud, Gilles Charmet, Boulos Chalhoub, Delphine Samson, François Balfourier, Aurélie Canaguier, Philippe Dufour, Michel Beckert, Alain Murigneux, Frédéric SapetF. Sapet, Catherine Ravel, Dominique Brunel, Génétique Diversité et Ecophysiologie des Céréales (GDEC), Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Institut National de la Recherche Agronomique (INRA), BIOGEMMA, Etude du Polymorphisme des Génomes Végétaux (EPGV), Institut National de la Recherche Agronomique (INRA), Unité de Recherche Génomique Info (URGI), Ulice, Agriculture pour la Chimie et l'Energie (AGRICE), Unité de recherche en génomique végétale (URGV), Centre National de la Recherche Scientifique (CNRS)-Université d'Évry-Val-d'Essonne (UEVE)-Institut National de la Recherche Agronomique (INRA), Institut National de la Recherche Agronomique (INRA)-Université Blaise Pascal - Clermont-Ferrand 2 (UBP), and Institut National de la Recherche Agronomique (INRA)-Université d'Évry-Val-d'Essonne (UEVE)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
0106 biological sciences ,SINGLE NUCLEOTIDE POLYMORPHISM ,Linkage disequilibrium ,SNP ,Single-nucleotide polymorphism ,HAPLOTYPE ,DESEQUILIBRE DE LIAISON ,Biology ,01 natural sciences ,Polymorphism, Single Nucleotide ,Linkage Disequilibrium ,Polyploidy ,03 medical and health sciences ,Gene Frequency ,Polymorphism (computer science) ,Genetics ,Molecular Biology ,Allele frequency ,Triticum ,030304 developmental biology ,2. Zero hunger ,0303 health sciences ,[SDV.GEN]Life Sciences [q-bio]/Genetics ,Haplotype ,food and beverages ,General Medicine ,Bread ,Gene deletion ,Tag SNP ,BASE DE DONNEES ,LIGNEES ,Haplotypes ,POLYMORPHISME D'UNE PAIRE DE BASE ,Databases, Nucleic Acid ,Gene Deletion ,Genome, Plant ,010606 plant biology & botany ,Biotechnology - Abstract
Information on single-nucleotide polymorphisms (SNPs) in hexaploid bread wheat is still scarce. The goal of this study was to detect SNPs in wheat and examine their frequency. Twenty-six bread wheat lines from different origins worldwide were used. Specific PCR-products were obtained from 21 genes and directly sequenced. SNPs were discovered from the alignment of these sequences. The overall sequence polymorphism observed in this sample appears to be low; 64 single-base polymorphisms were detected in ~21.5 kb (i.e., 1 SNP every 335 bp). The level of polymorphism is highly variable among the different genes studied. Fifty percent of the genes studied contained no sequence polymorphism, whereas most SNPs detected were located in only 2 genes. As expected, taking into account a synthetic line created with a wild Triticum tauschii parent increases the level of polymorphism (101 SNPs; 1 SNP every 212 bp). The detected SNPs are available at http://urgi.versailles.inra.fr/GnpSNP. Data on linkage disequilibrium (LD) are still preliminary. They showed a significant level of LD in the 2 most polymorphic genes. To conclude, the genome size of hexaploid wheat and its low level of polymorphism complicate SNP discovery in this species.; La fréquence des marqueurs de type polymorphisme d'une paire de base (SNP) est encore mal connue chez le blé tendre hexaploïde. L'objectif du travail présenté est donc d'étudier l'abondance de ces marqueurs dans cette espèce. Pour cela 21 gènes (ou fragments) ont été amplifiés spécifiquement par PCR puis séquencés dans une collection de 26 lignées de blé tendre. Dans cet échantillon, nous avons détecté 64 évènements de polymorphisme d'une base pour environ 21,5 kb. Le niveau global de polymorphisme est relativement faible (1 SNP pour 334 pb) et très variable d'un gène à l'autre. La moitié des gènes étudiés est monomorphe alors que la plupart des SNPs proviennent de seulement 2 gènes. Le niveau de polymorphisme est augmenté par la prise en compte d'une lignée de blé synthétique (101 SNP; 1 SNP pour 212 pb). Tous les SNP détectés sont disponibles à http://urgi.versailles.inra.fr/GnpsSNP. Nous avons calculé le déséquilibre de liaison (DL) en utilisant les données des 2 gènes les plus polymorphes, situés sur le chromosome 1BL et distants de 1,3 cM. Le DL intragénique est significatif. Pour conclure, la taille et le faible niveau de polymorphisme du génome du blé hexaploïde compliquent la recherche de SNP dans cette espèce.
- Published
- 2006
- Full Text
- View/download PDF
41. Structure of linkage disequilibrium and length of IBD segments in simulated populations
- Author
-
Ytournel, Florence, Gilbert, Hélène, Druet, Tom, Boichard, Didier, Station de Génétique Quantitative et Appliquée (SGQA), and Institut National de la Recherche Agronomique (INRA)
- Subjects
LINKAGE DISEQUILIBRIUM ,[SDV]Life Sciences [q-bio] ,qtl ,QTL ,déséquilibre de liaison - Published
- 2006
42. Cartographie génétique fine par le graphe de recombinaison ancestral
- Author
-
Larribe, Fabrice, Lessard, Sabin, and Schork, Nicholas
- Subjects
Cartographie génétique fine ,Arbre de recombinaison ancestral (ARG) ,Processus de coalescence ,Taille de population variable ,Déséquilibre de liaison - Abstract
Thèse diffusée initialement dans le cadre d'un projet pilote des Presses de l'Université de Montréal/Centre d'édition numérique UdeM (1997-2008) avec l'autorisation de l'auteur.
- Published
- 2004
43. Linkage disequilibrium fine mapping of quantitative trait loci: a simulation study
- Author
-
Bruno Goffinet, Jihad Abdallah, Miguel Pérez-Enciso, Christine Cierco-Ayrolles, Station d'Amélioration Génétique des Animaux (SAGA), Institut National de la Recherche Agronomique (INRA), and Unité de Biométrie et Intelligence Artificielle (UBIA)
- Subjects
0106 biological sciences ,Linkage disequilibrium ,lcsh:QH426-470 ,[SDV]Life Sciences [q-bio] ,Population ,Quantitative Trait Loci ,caractère quantitatif ,Biology ,Quantitative trait locus ,01 natural sciences ,03 medical and health sciences ,quantitative trait locus ,Family-based QTL mapping ,Inclusive composite interval mapping ,Genetics ,Animals ,Humans ,Computer Simulation ,Genetics(clinical) ,Selection, Genetic ,déséquilibre de liaison ,Association mapping ,education ,Ecology, Evolution, Behavior and Systematics ,ComputingMilieux_MISCELLANEOUS ,030304 developmental biology ,Genetic association ,lcsh:SF1-1100 ,Linkage (software) ,0303 health sciences ,education.field_of_study ,cartographie fine ,Research ,Chromosome Mapping ,food and beverages ,General Medicine ,[SDV.GEN.GA]Life Sciences [q-bio]/Genetics/Animal genetics ,lcsh:Genetics ,Data Interpretation, Statistical ,fine mapping ,Animal Science and Zoology ,lcsh:Animal culture ,linkage disequilibrium ,010606 plant biology & botany - Abstract
International audience; Recently, the use of linkage disequilibrium (LD) to locate genes which affect quantitative traits (QTL) has received an increasing interest, but the plausibility of fine mapping using linkage disequilibrium techniques for QTL has not been well studied. The main objectives of this work were to (1) measure the extent and pattern of LD between a putative QTL and nearby markers in finite populations and (2) investigate the usefulness of LD in fine mapping QTL in simulated populations using a dense map of multiallelic or biallelic marker loci. The test of association between a marker and QTL and the power of the test were calculated based on single-marker regression analysis. The results show the presence of substantial linkage disequilibrium with closely linked marker loci after 100 to 200 generations of random mating. Although the power to test the association with a frequent QTL of large effect was satisfactory, the power was low for the QTL with a small effect and/or low frequency. More powerful, multi-locus methods may be required to map low frequent QTL with small genetic effects, as well as combining both linkage and linkage disequilibrium information. The results also showed that multiallelic markers are more useful than biallelic markers to detect linkage disequilibrium and association at an equal distance.
- Published
- 2003
- Full Text
- View/download PDF
44. Modèles alternatifs pour la détection de QTL dans les populations animales. III. Modèle hétéroscédastique et modèles correspondant à différentes distributions de l’effet du QTL
- Author
-
Pascale Le Roy, Jean-Michel Elsen, Brigitte Mangin, Bruno Goffinet, Didier Boichard, Unité de Biométrie et Intelligence Artificielle (UBIA), Institut National de la Recherche Agronomique (INRA), Station de Génétique Quantitative et Appliquée (SGQA), Station d'Amélioration Génétique des Animaux (SAGA), and INRA - Mathématiques et Informatique Appliquées (Unité MIAJ)
- Subjects
Heteroscedasticity ,Linkage disequilibrium ,HETEROSKEDASTIC MODEL ,LINKAGE DISEQUILIBRIUM ,lcsh:QH426-470 ,FAMILLE DE DEMI-FRERES ,HALF-SIB FAMILIES ,QTL DETECTION ,MODELE HETEROSCEDASTIQUE ,DESEQUILIBRE DE LIAISON ,Biology ,Quantitative trait locus ,03 medical and health sciences ,Statistics ,Genetic variation ,Genetics ,Genetics(clinical) ,déséquilibre de liaison ,Selection (genetic algorithm) ,Ecology, Evolution, Behavior and Systematics ,030304 developmental biology ,lcsh:SF1-1100 ,[SDV.GEN]Life Sciences [q-bio]/Genetics ,0303 health sciences ,Infinite number ,business.industry ,Research ,0402 animal and dairy science ,food and beverages ,04 agricultural and veterinary sciences ,General Medicine ,040201 dairy & animal science ,lcsh:Genetics ,[SDV.GEN.GA]Life Sciences [q-bio]/Genetics/Animal genetics ,détection de qtl ,Livestock ,Animal Science and Zoology ,lcsh:Animal culture ,business ,DETECTION DE QTL - Abstract
This paper describes two kinds of alternative models for QTL detection in livestock: an heteroskedastic model, and models corresponding to several hypotheses concerning the distribution of the QTL substitution effect among the sires: a fixed and limited number of alleles or an infinite number of alleles. The power of different tests built with these hypotheses were computed under different situations. The genetic variance associated with the QTL was shown in some situations. The results showed small power differences between the different models, but important differences in the quality of the estimations. In addition, a model was built in a simplified situation to investigate the gain in using possible linkage disequilibrium., Ce papier décrit deux types de modèles alternatifs pour la détection de QTL dans les populations animales : un modèle hétéroscédastique d’une part, et des modèles correspondants à différentes hypothèses sur la distribution de l’effet de substitution du QTL pour chaque mâle : un nombre fixe et limité d’allèles ou au contraire un nombre infini d’allèles. Les puissances des différents tests construits avec ces hypothèses sont calculées dans différentes situations. L’estimation de la variance génétique liée au QTL est donnée dans certaines situations. Les résultats montrent de faibles différences de puissance entre les différents modèles, mais des différences importantes dans la qualité des estimations. De plus, on construit un modèle dans une situation simplifiée pour étudier le gain que l’on peut obtenir en utilisant un éventuel déséquilibre de liaison.
- Published
- 1999
45. Genetic analysis of root traits in maize
- Author
-
Emmanuelle Guingo, Y. Hébert, Alain Charcosset, and Revues Inra, Import
- Subjects
[SDV.SA]Life Sciences [q-bio]/Agricultural sciences ,Population ,verse en végétation ,Locus (genetics) ,Root system ,Quantitative trait locus ,Biology ,Genetic analysis ,zea mays ,Inbred strain ,Botany ,Genetic variability ,déséquilibre de liaison ,education ,ComputingMilieux_MISCELLANEOUS ,[SDV.EE]Life Sciences [q-bio]/Ecology, environment ,education.field_of_study ,[SDV.SA] Life Sciences [q-bio]/Agricultural sciences ,qtl ,food and beverages ,Agricultural sciences ,[SDV.EE] Life Sciences [q-bio]/Ecology, environment ,PLEITROPIE ,Agronomy ,Genetic marker ,Agronomy and Crop Science ,Sciences agricoles - Abstract
In many areas around the world, maize (Zea Mays L.) crops are affected by root lodging. Several authors have previously shown that associations of root and shoot traits enabled the prediction of the resistance of genotypes to root lodging. In this preliminary attempt to understand the genetics of these traits, a set of 100 recombinant inbred lines from a cross between élite lines ’F2’ (early, susceptible to root lodging) and ’Io’ (late, lodging resistant) was considered. This population was characterised for 152 RFLP loci and root system traits in one location and for 2 years. QTLs were mapped using the average over years. Genetic and environmental correlations, together with co-localisation of QTLs for several traits, revealed genetic linkages, and some probable pleiotropic effects, which could be interpreted in terms of within-plant growth competition phenomena. The identification, on chromosome 5, of groups of loci involved in the control of the growth of the root system could help select against root lodging. (© Inra/Elsevier, Paris.), Dans de nombreuses régions du monde, la verse en végétation peut porter préjudice à la rentabilité de la culture de maïs. Plusieurs auteurs ont mis en évidence que des caractéristiques aériennes et racinaires, considérées ensemble, sont déterminantes dans la variation de la résistance. Dans une première approche, les caractères impliqués dans la résistance à la verse sont analysés génétiquement dans un lieu sur deux années, à partir de 100 lignées recombinantes issues du croisement de ’F2’ et ’Io’. À l’aide de 152 marqueurs RFLP, les QTL sont recherchés sur la moyenne des deux années. À partir des corrélations génétiques et environnementales ou à partir de la co-localisation des QTL, des linkages et des effets pléiotropiques entre les caractères sont révélés. La mise en évidence, sur le chromosome 5, de groupes de locus impliqués dans la croissance du système racinaire pourrait faciliter la sélection de génotypes résistants à la verse en végétation. (© Inra/Elsevier, Paris.)
- Published
- 1998
46. Valeur des marqueurs RAPD (Random Amplified Polymorphic DNA) dans l'étude de la microvariabilité d'un clonet majeur de Trypanosoma cruzi, agent de la maladie de Chagas
- Author
-
Tarrieu, Frédérique
- Subjects
GENETIQUE DE POPULATION ,RAPD.RANDOM AMPLIFIED POLYMORPHIC DNA ,CLONE NATUREL ,ISOENZYME ,MALADIE DE CHAGAS ,MICROEVOLUTION ,MARQUAGE GENETIQUE ,PHYLOGENIE ,DESEQUILIBRE DE LIAISON ,AGENT PATHOGENE - Abstract
L'analyse de 57 souches de #Trypanosoma cruzi$ par amplification de l'ADN par amorces aléatoires (Random Amplification of Polymorphic DNA=RAPD), et la comparaison des résultats avec des données isoenzymatiques obtenues indépendamment, ont permis de confirmer la valeur de cette nouvelle méthode comme outil épidémiologique et phylogénique. Cette étude, basée sur un marquage génétique très résolutif, a montré une variabilité génotypique non négligeable au sein des souches appartenant à un "clonet" (ensemble de génotypes clonaux apparaissant comme identiques pour une série de marqueurs donnée) antérieurement décrit. Dans le cadre d'un débat récemment ouvert, du fait d'un manque de puissance des tests statistiques dû à une variabilité génétique insuffisante, les présentes données ne permettent pas de dire si ce "clonet" est effectivement composé de génotypes clonaux, ou s'il correspond au contraire à une espèce cryptique sexuée. Cependant, la méthodologie nécessaire pour reprendre la question a été dégagée. (Résumé d'auteur)
- Published
- 1994
47. Microevolution of Trypanosoma cruzi natural clones
- Author
-
Neubauer, Katja
- Subjects
GENETIQUE DE POPULATION ,RAPD.RANDOM AMPLIFIED POLYMORPHIC DNA ,CLONE NATUREL ,ISOENZYME ,parasitic diseases ,MALADIE DE CHAGAS ,DESEQUILIBRE DE LIAISON ,BIOLOGIE MOLECULAIRE ,AGENT PATHOGENE ,PCR.REACTION DE POLYMERISATION EN CHAINE ,SONDE ,ADN KINETOPLASTIQUE - Abstract
Isoenzyme analysis of Chilean and Paraguayan stocks of #Trypanosoma cruzi$, the agent of Chagas' disease, was performed at 19 variable genetic loci. The results were interpreted in terms of evolutionary and population genetics. As previously shown for this parasite in other geographic areas, a basically clonal population structure was evidended, by both strong departures from Hardy-Weinberg expectations and high linkage disequilibrium. The isoenzyme variants of #Trypanosama cruzi$ (or zymodemes) behave as natural clones, stable in space and time, and should be considered as the relevant taxonomic unit for medical studies. Two main clusters of clones were evidenced, separated by high genetic distances. Comparison between clonal populations in sylvatic and domestic transmission cycles of the disease in Chile strongly suggested that these two cycles are at least partly separated from one another. For comparison purposes with the isoenzyme results, two molecular techniques were performed, namely DNA-probe analysis of the kinetoplast DNA (an extranuclear genome) and Arbitrarily Primed Polymerase Chain Reaction (AP-PCR). The results of these two methods corroborated the isoenzyme data, and AP-PCR appeared as a new and promising tool for #Trypanosoma cruzi$ strain identification. (Résumé d'auteur)
- Published
- 1991
48. Imputation-Based Analysis of Association Studies: Candidate Regions and Quantitative Traits
- Author
-
Matthew Stephens, Bertrand Servin, Laboratoire de Génétique Cellulaire (LGC), Institut National de la Recherche Agronomique (INRA)-Ecole Nationale Vétérinaire de Toulouse (ENVT), Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées, Department of Statistics, University of Washington [Seattle], and Servin, Bertrand
- Subjects
haplotype ,Cancer Research ,Candidate gene ,Genotype ,lcsh:QH426-470 ,[SDV]Life Sciences [q-bio] ,polymorphisme snp ,Single-nucleotide polymorphism ,Genome-wide association study ,Computational biology ,Quantitative trait locus ,Biology ,Models, Biological ,Polymorphism, Single Nucleotide ,03 medical and health sciences ,0302 clinical medicine ,génétique d'association ,Homo (Human) ,Odds Ratio ,Genetics ,Humans ,déséquilibre de liaison ,International HapMap Project ,Molecular Biology ,Genetics (clinical) ,Ecology, Evolution, Behavior and Systematics ,030304 developmental biology ,Genetic association ,0303 health sciences ,Models, Statistical ,Polymorphism, Genetic ,Chromosome Mapping ,Computational Biology ,Genetics and Genomics ,Bayes Theorem ,Genomics ,Tag SNP ,lcsh:Genetics ,Phenotype ,Data Interpretation, Statistical ,Mathematics ,Software ,030217 neurology & neurosurgery ,Imputation (genetics) ,Research Article - Abstract
We introduce a new framework for the analysis of association studies, designed to allow untyped variants to be more effectively and directly tested for association with a phenotype. The idea is to combine knowledge on patterns of correlation among SNPs (e.g., from the International HapMap project or resequencing data in a candidate region of interest) with genotype data at tag SNPs collected on a phenotyped study sample, to estimate (“impute”) unmeasured genotypes, and then assess association between the phenotype and these estimated genotypes. Compared with standard single-SNP tests, this approach results in increased power to detect association, even in cases in which the causal variant is typed, with the greatest gain occurring when multiple causal variants are present. It also provides more interpretable explanations for observed associations, including assessing, for each SNP, the strength of the evidence that it (rather than another correlated SNP) is causal. Although we focus on association studies with quantitative phenotype and a relatively restricted region (e.g., a candidate gene), the framework is applicable and computationally practical for whole genome association studies. Methods described here are implemented in a software package, Bim-Bam, available from the Stephens Lab website http://stephenslab.uchicago.edu/software.html., Author Summary Ongoing association studies are evaluating the influence of genetic variation on phenotypes of interest (hereditary traits and susceptibility to disease) in large patient samples. However, although genotyping is relatively cheap, most association studies genotype only a small proportion of SNPs in the region of study, with many SNPs remaining untyped. Here, we present methods for assessing whether these untyped SNPs are associated with the phenotype of interest. The methods exploit information on patterns of multi-marker correlation (“linkage disequilibrium”) from publically available databases, such as the International HapMap project or the SeattleSNPs resequencing studies, to estimate (“impute”) patient genotypes at untyped SNPs, and assess the estimated genotypes for association with phenotype. We show that, particularly for common causal variants, these methods are highly effective. Compared with standard methods, they provide both greater power to detect associations between genetic variation and phenotypes, and also better explanations of detected associations, in many cases closely approximating results that would have been obtained by genotyping all SNPs.
- Published
- 2007
- Full Text
- View/download PDF
49. Natural populations of Trypanosoma cruzi, the agent of Chagas disease, have a complex multiclonal structure
- Author
-
Philip J. Ward, Michel Tibayrenc, Francisco J. Ayala, and Andrés Moya
- Subjects
Most recent common ancestor ,Trypanosoma cruzi ,Population genetics ,DESEQUILIBRE DE LIAISON ,RESEAU DE WAGNER ,VARIATION ENZYMATIQUE ,CLONE ,parasitic diseases ,TRYPANOSOMIASE HUMAINE ,Animals ,Genetic variability ,Allele ,SPECIATION ,LIAISON GENETIQUE ,Mexico ,Alleles ,Genetics ,Multidisciplinary ,Polymorphism, Genetic ,biology ,Genetic heterogeneity ,South America ,biology.organism_classification ,Biological Evolution ,Diploidy ,EVOLUTION ,United States ,Isoenzymes ,MALADIE DE CHAGAS ,Trypanosoma ,Adaptation ,AGENT PATHOGENE ,Research Article - Abstract
We have studied 15 gene loci coding for enzymes in 121 Trypanosoma cruzi stocks from a wide geographic range--from the United States and Mexico to Chile and southern Brazil. T. cruzi is diploid but reproduction is basically clonal, with very little if any sexuality remaining at present. We have identified 43 different clones by their genetic composition; the same genetic clone is often found in very distant places and in diverse hosts. There is much genetic heterogeneity among the different clones, and they cannot be readily classified into a few discrete groups that might represent natural taxa. These findings imply that the biological and medical characteristics need to be ascertained separately for each natural clone. The evidence indicates that clonal evolution is very ancient in T. cruzi. We propose two alternative hypotheses concerning the relationship between the biochemical diversity and the heterogeneity in other biological and medical characteristics of T. cruzi. One hypothesis is that the degree of diversity between strains simply reflects the time elapsed since their last common ancestor. The second hypothesis is that biological and medical heterogeneity is recent and reflects adaptation to different transmission cycles. A decision between the two hypotheses can be reached with appropriate studies, with important medical consequences.
- Published
- 1986
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.