39 results on '"déséquilibre de liaison"'
Search Results
2. Hunting for causal variants in microbial genomes
- Author
-
Chen, Peter and Shapiro, Jesse
- Subjects
Homoplasy counting ,Microbial GWAS ,Linkage disequilibrium ,Allele counting ,Genetic architecture ,Étude d’association génomique microbienne ,Comptage d'allèles ,Comptage d'homoplasie ,Déséquilibre de liaison ,Architecture génétique - Abstract
L'un des objectifs centraux de la biologie est de comprendre comment l'ADN, la séquence primaire, donne lieu à des traits observables. À cette fin, nous examinons ici des méthodes pour identifier les composants génétiques qui influencent les traits microbiens. Par « identifier », nous entendons l'élucidation à la fois l'état allélique et de la position physique de chaque variante causale d'un phénotype d'intérêt à la résolution des nucléotides de paires de bases. Nous nous sommes concentrés sur les études d'association génomique (genome-wide association studies; GWAS) en tant qu'approche générale d’étudier l'architecture génétique des traits. L'objectif global de cette thèse était d'examiner de manière critique les méthodologies GWAS et de les considérer en pratique dans des populations microbiennes fortement clonales et non- clonales (i.e. avec recombinaison fréquent). Le domaine de la GWAS microbienne est relativement nouveau par rapport aux quinze dernières années de la GWAS humaine, et en tant que tel, nous avons commencé par un examen de l'état de la GWAS microbienne. Nous avons posé deux questions principales : 1) Les méthodes GWAS humaines fonctionnent-elles facilement et sans modification pour les populations microbiennes ? 2) Et sinon, quels sont les problèmes méthodologiques centraux et les modifications nécessaires pour la GWAS microbienne? À partir de ces résultats, nous avons ensuite détaillé le déséquilibre de liaison (linkage disequilibrium; LD) comme principal obstacle dans la GWAS microbien, et nous avons présenté une nouvelle méthode, POUTINE, pour relever ce défi en exploitant les mutations homoplasiques pour briser implicitement la structure LD. Le reste de la thèse présente à la fois les méthodes traditionnelles GWAS (comptage des allèles) et POUTINE (comptage d’homoplasies) appliquées à une population hautement recombinogène de génomes de vibrions marins. Malgré une taille d'échantillon modeste, nous donnons un premier aperçu de l'architecture génétique de la résistance aux bactériophages dans une population naturelle, tout en montrant que les récepteurs des bactériophages jouent un rôle primordial. Ce résultat est en pleine cohérence avec des expériences en laboratoire de coévolution phage-bactérie. Il est important de noter que cette architecture met en évidence à quel point la sélection positive peut sculpter certains traits microbiens différemment de nombreux traits complexes humains, qui sont généralement soumis à une faible sélection purificatrice. Plus précisément, nous avons identifié des mutations à effet important à haute fréquence qui sont rarement observées dans les phénotypes complexes humains où de nombreuses mutations à faible effet contribuent à l'héritabilité. La thèse se termine par des perspectives sur les voies à suivre pour la GWAS microbienne., One of the central goals of biology is to understand how DNA, the primary sequence, gives rise to observable traits. To this aim, we herein examine methods to identify the genetic components that influence microbial traits. By "identify" we mean the elucidation of both the allelic state and physical position of each causal variant of a phenotype of interest down to the base-pair nucleotide resolution. Our focus has been on genome-wide association studies (GWAS) as a general approach to dissecting the genetic architecture of traits. The overarching aim of this thesis was to critically examine GWAS methodologies and to consider them in practice in both strongly clonal and highly recombining microbial populations. The field of microbial GWAS is relatively new compared to the over fifteen years of human GWAS, and as such, we began this work with an examination of the state of microbial GWAS. We asked and attempted to answer two main questions: 1) Do human GWAS methods readily work without modification for microbial populations? 2) And if not, what are the central methodological problems and changes that are required for a successful microbial GWAS? Building from these findings, we then detailed linkage disequilibrium (LD) as the primary obstacle in microbial GWAS, and we presented a new method, POUTINE, to address this challenge by harnessing homoplasic mutations to implicitly break LD structure. The remainder of the thesis showcases both traditional GWAS methods (allele counting) and POUTINE applied to a highly recombining population of marine vibrio genomes. Despite a small sample size, we provide a first glimpse into the genetic architecture of bacteriophage resistance in a natural population and show that bacteriophage receptors play a primary role consistent with experimental populations of phage-bacteria coevolution. Importantly, this architecture highlights how strong positive selection can sculpt some microbial traits differently than many human complex traits, which are generally under weak purifying selection. Specifically, we identified common frequency, large-effect mutations that are rarely observed in human complex phenotypes where many low-effect mutations are thought to contribute to the bulk of heritability. The thesis concludes with perspectives on ways forward for microbial GWAS.
- Published
- 2022
3. Méthodes d’inférence démographique récente utilisant les polymorphismes et leur liaison génétique
- Author
-
Kerdoncuff, Elise and STAR, ABES
- Subjects
Population genetics ,Coalescence theory ,Inference methods ,Déséquilibre de liaison ,Génétique des populations ,Démographie ,Génétique de la conservation ,Théorie de la coalescence ,[SDV.GEN.GPO] Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,Conservation genetics ,Méthodes d’inférences ,Demography ,Inkage disequilibrium ,[SDV.BID] Life Sciences [q-bio]/Biodiversity - Abstract
The impact of human industrial activities leads to a significant biodiversity loss. However, 94% of described species do not have a conservation status, which is essential to implement conservation policies. Indeed, methods used to assign these statuses are generally qualitative and can not be applied properly to all species. We have proposed a quantitative methodology using multiple genome alignments sampled in a given population to infer its recent demographic history, in particular detecting sudden changes in population size. We used both the information from polymorphisms, summarized by the site frequency spectrum, and the information from their genetic linkage, summarized by the length distribution of non-recombinant DNA segments, or segments compatible with a single genealogy. We have shown that these two sources of information are not affected in the same way by the different parameters of the demographic scenario considered. It is therefore possible to have a more accurate inference by combining these two sources of information, both to select a scenario and to infer its parameters., L'impact des activités industrielles humaines conduit à une érosion importante de la biodiversité. Cependant, 94% des espèces décrites ne possèdent pas de statut de conservation, pourtant indispensable à la mise en place de politiques de conservation. En effet, les méthodes utilisées pour attribuer ces statuts sont généralement qualitatives et ne peuvent s’appliquer de manière rigoureuse à l’ensemble des espèces. Nous avons proposé une méthodologie quantitative utilisant les alignements multiples de génomes échantillonnés dans une population donnée pour en inférer l’histoire démographique récente, détectant notamment les changements soudains de taille de population. Nous avons utilisé à la fois l'information issue des polymorphismes, résumée par leur spectre de fréquence, et celle issue de leur liaison génétique, résumée par la distribution des longueurs de segments d’ADN non recombinés, ou compatibles avec une seule généalogie. Nous avons démontré que ces deux sources d’informations n’étaient pas affectées de la même manière par les différents paramètres du scénario démographique considéré. Il est donc possible de gagner en précision en combinant ces deux informations, aussi bien pour sélectionner un scénario que pour en inférer les paramètres. Nous nous sommes également intéressés à un modèle d’évolution moléculaire plus général que le coalescent standard autorisant les multifurcations dans les généalogies et avons démontré que l’utilisation de ce modèle permettait d’expliquer une plus grande partie de la diversité observée.
- Published
- 2021
4. A possible breakage of linkage disequilibrium between mitochondrial and chloroplast genomes during Emmer and Dinkel wheat evolution.
- Author
-
Tsujimura, Mai, Mori, Naoki, Yamagishi, Hiroshi, Terachi, Toru, and Bonen, L.
- Subjects
- *
MITOCHONDRIAL DNA , *AEGILOPS , *LINKAGE (Genetics) , *EMMER wheat , *MICROSATELLITE repeats , *CHLOROPLASTS - Abstract
In wheat ( Triticum) and Aegilops, chloroplast and mitochondrial genomes have been studied for over three decades to clarify the phylogenetic relationships among species, and most of the maternal lineages of polyploid species have been clarified. Mitochondrial genomes of Emmer (tetraploid with nuclear genome AABB) and Dinkel (hexaploid with AABBDD) wheat are classified into two different types, VIIa and VIIb, by the presence-absence of the third largest HindIII fragment (named H3) in the mitochondrial DNA. Although the mitochondrial genome in the genera often provides useful information to clarify the phylogenetic relationship among closely related species, the phylogenetic significance of this dimorphism has yet not been clarified. In this study, to facilitate analysis using a large number of accessions, a sequence characterized amplified region (SCAR) marker that distinguishes the type VIIb mitochondrial genome from type VIIa was first developed. Mitochondrial genome type was determined for each of 30 accessions of wild and cultivated Emmer wheat and 25 accessions of Dinkel wheat. The mitochondrial genome type for each accession was compared with the plastogroup that had been determined using chloroplast microsatellite markers. Unexpectedly, the distribution of mitochondrial genome type was not in accordance with that of the plastogroups, suggesting occasional paternal leakage of either the mitochondrial or chloroplast genome during speciation and differentiation of Emmer and Dinkel wheat. An alternative possibility that substoichiometric shifting is involved in the observed dimorphism of the mitochondrial genome is also discussed. [ABSTRACT FROM AUTHOR]
- Published
- 2013
- Full Text
- View/download PDF
5. Genetic diversity of maize kernel starch-synthesis genes with SNAPs.
- Author
-
Ji-Hyun Shin, Soon-Jae Kwon, Ju Kyong Lee, Hwang-Kee Min, and Nam-Soo Kim
- Subjects
- *
CORN breeding , *STARCH , *GENETIC polymorphisms , *GENES , *POPULATION genetics - Abstract
Measuring genetic diversity in populations of a crop species is very important for understanding the genetic structure of and subsequently improving the crop species by genetic manipulation. Single-nucleotide amplified polymorphisms (SNAPs) among and within maize populations of waxy, dent, and sweet corns at 25 single-nucleotide polymorphism (SNP) sites in 6 kernel starch-synthesis genes (sh2, bt2, su1, ae1, wx1, and sh1) were determined. Because of the intensive selection of some favorable alleles in starch-synthesis genes during the breeding process, and the resultant strong linkage disequilibrium (LD), the number of haplotypes in each population was far less than expected. Subsequent phenetic clustering analysis with the SNAPs indicated that the dent, waxy, and sweet corns formed distinct subclusters, except in a few incidences. LD was surveyed among SNAPs of intragenic, intergenic, and intrachromosomal SNPs in whole and subpopulations, which revealed that some SNAPs showed high LD with many other SNAPs, but some SNAPs showed low or no significant LD with others, depending on the subpopulation, indicating that these starch genes have undergone different selection in each subpopulation during the breeding process. Because the starch synthesis genes used in this study are important in maize breeding, the genetic diversity, LD, and accessions having rare SNAP alleles might be valuable in maize improvement programs. [ABSTRACT FROM AUTHOR]
- Published
- 2006
- Full Text
- View/download PDF
6. Étude du déséquilibre de liaison dans des lignées de poules de types génétiques 'ponte' et 'chair'
- Author
-
Hérault, Frédéric, Varenne, Amandine, Burlot, Thierry, Recoquillay, Julien, Macé, Camille, Fagnoul, Frédéric, Picard Druet, David, Herry, Florian, Allais, Sophie, Le Roy, Pascale, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), Novogen, Hubbard SAS, Partenaires INRAE, NOVOGEN, Groupe Grimaud, Hubbard, and AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA)
- Subjects
volaille ,[SDV.GEN]Life Sciences [q-bio]/Genetics ,[SDV.GEN.GA]Life Sciences [q-bio]/Genetics/Animal genetics ,cartographie fine ,qtl ,[SDV]Life Sciences [q-bio] ,[INFO]Computer Science [cs] ,poule ,évaluation génomique ,génotype ,déséquilibre de liaison - Abstract
La structure du déséquilibre de liaison (DL) au sein des populations en sélection impacte fortement la précision obtenue lors des études de cartographie de QTL ou lors de l’évaluation génomique des reproducteurs. Chez les oiseaux, la structure hétérogène du génome nécessite de décrire précisément le DL pour optimiser la sélection. L’utilisation des puces SNP haute densité pour le génotypage des populations de volailles est une opportunité pour approfondir notre connaissance de la structure du DL de ces populations. L’objectif de cette étude est d’acquérir une connaissance haute résolution de la structure du DL au sein de populations de poules de types ponte et chair. Nous avons analysé les génotypes (puce 600 K Affymetrix® Axiom® HD SNP) de 1541 animaux issus de 3 populations. L’étendue et le niveau du DL ont été estimés par le r2 moyen à distance physique donnée entre SNP. Cette étude met en évidence des différences importantes de structure du DL entre lignées et entre chromosomes. L’étendue et le niveau du DL sont plus importants dans les lignées de type ponte ou pour les macro-chromosomes et le chromosome Z. Ce niveau important de DL peut faciliter la détection de QTL sur ces chromosomes, mais peut également compliquer la localisation fine de polymorphismes causaux. A l’inverse, le faible niveau de DL observé sur les micro-chromosomes nécessite l’utilisation d’une forte densité de SNP pour détecter une association avec un phénotype, mais devrait permettre la cartographie fine d’un polymorphisme causal. Ces différences sont à prendre en considération pour définir une stratégie de génotypage économique et efficace pour la cartographie fine de QTL ou l’évaluation génomique., Knowledge of the linkage disequilibrium (LD) pattern is useful in animal genetic studies as it underlies mapping studies and genomic selection. This is all the more important in birds given the heterogeneous structure of the avian karyotype. Recently, the availability of the high density 600 K Affymetrix® Axiom® HD SNP genotyping array allowed to assess an in-depth knowledge of the LD pattern in chicken genome. The aim of the present study was to assess a higher resolution of the LD pattern in chicken genome in layer and broiler lines. In this study, we analyzed genotypes of 1541 animals from layers and broiler commercial populations to characterize their LD pattern. LD was measured by the average r2 value at a given physical distance between SNP. LD extended over a larger region for layer lines than for broiler line. Most differences between lines appeared at small interval distances (< 0.5Mb). LD extent and decay differed considerably between chromosomes categories. Average r2 values were higher for Z chromosome than for macro, intermediates and microchromosomes. The extent of useful LD observed for autosomal chromosomes was at least ten-fold longer for layer lines than for broiler. Finally, this study shed light on high LD for Z chromosome. The differences in LD pattern observed between chromosomes and chicken lines should be taken into account to define an economically efficient genotyping strategy.
- Published
- 2019
7. Design of a low density SNP chip for genotype imputation in layer chickens
- Author
-
HERRY, Florian, Hérault, Frédéric, Picard--Druet, David, Varenne, Amandine, Burlot, Thierry, Le Roy, Pascale, Allais, Sophie, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA), Novogen, ANR-10-GENOM_BTV-015 UtOpIGe, Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, and Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)
- Subjects
Animal biology ,Imputation accuracy ,Layer chickens ,Low density SNP panel ,Linkage disequilibrium ,polymorphisme nucléotidique simple (SNP) ,[SDV.BA]Life Sciences [q-bio]/Animal biology ,laying hen ,évaluation génomique ,poule pondeuse ,génotypage ,Biologie animale ,déséquilibre de liaison ,précision de sélection - Abstract
The main goal of selection is to choose breeders of the next generation among a set of selection candidates. In genomic selection, the choice of breeders is based on the use of information on DNA polymorphisms, in particular SNP, in addition of performance measures. Since 2013, a commercial high density genotyping chip (600,000 markers) for chicken allowed the implementation of genomic selection in layer and broiler breeding. However, genotyping costs with this chip still remain high for a routine use on a large number of selection candidates. Consequently, it is interesting to develop, at a lower cost, low density genotyping chips. To do so, a set of SNP markers has to be selected to enable an imputation (prediction) of missing genotypes with high accuracy on a high density chip (HD chip). In this perspective, we conducted various simulation studies to choose the optimal strategy for low density genotyping of two different lines of laying hen. Different low density genotyping chips were designed according to two methodologies: a choice of SNP depending on a clustering of SNP based on linkage disequilibrium threshold or a choice of SNP at regular intervals (kb) along each chromosome. Imputation accuracy was assessed as the mean correlation between true and imputed genotypes. Results showed that correlations were more sensitive to false imputation of SNPs with low Minor Allele Frequency (MAF) with the equidistant methodology. Imputation accuracy improved with SNP density and when a higher LD threshold is used for SNP selection. Given the particular structure of the avian genome with chromosomes of very heterogeneous sizes and extents of LD, imputation accuracy differed according to the type of chromosome. All the simulation studies showed that linkage disequilibrium methodology enabled to get better results of imputation than with equidistant methodology.
- Published
- 2018
8. Impact of the size of the reference population and kinship degree on low density genotyping strategies for genotype imputation in layer chickens
- Author
-
Burlot, Thierry, Herry, Florian, Hérault, Frédéric, Picard--Druet, David, Varenne, Amandine, Le Roy, Pascale, Allais, Sophie, Novogen, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA), ANR-10-GENOM_BTV-015 UtOpIGe, Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), AGROCAMPUS OUEST, and Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de la Recherche Agronomique (INRA)
- Subjects
Animal biology ,polymorphisme nucléotidique simple (SNP) ,Imputation accuracy ,Layer chickens ,Reference population ,Kinship degree ,[SDV.BA]Life Sciences [q-bio]/Animal biology ,laying hen ,évaluation génomique ,poule pondeuse ,génotypage ,Biologie animale ,déséquilibre de liaison ,précision de sélection - Abstract
The main goal of selection is to choose breeders of the next generation among a set of selection candidates. In genomic selection, the choice of breeders rests on the use of information on DNA polymorphisms, in particular SNP, in addition of performance measures. Since 2013, a commercial high density genotyping chip (600,000 markers) for chicken allowed the implementation of genomic selection in layer and broiler breeding. However, genotyping costs with this chip still remain high for a routine use on a large number of selection candidates. Consequently, it is interesting to develop, at a lower cost, low density genotyping chips. To do so, a set of SNP markers has to be selected to enable an imputation (prediction) of missing genotypes on a high density chip (HD chip). This imputation enables to predict missing genotypes of all selection candidates from high density genotyping of a reference population with phenotypes. In this perspective, according to the reference population, various simulation studies were conducted to choose the best strategy for low density genotyping of laying hen lines. Two different low density genotyping chips of 10K SNP were designed according to two methodologies: a choice of SNP depending on a clustering based on linkage disequilibrium threshold or a choice of SNP at regular intervals (kb) along each chromosome. Imputation accuracy was assessed as the mean correlation between true and imputed genotypes. Focusing on populationnal factors that can influence imputation accuracy, it is shown that imputation accuracy improves with an increase in the size of the reference population. By decreasing the kinship degree between reference and candidate population, it is seen that imputation accuracy decreases. Most importantly, results show that a key point in getting good imputations is to have the direct parents in the reference population. Finally, all different genotyping strategies focused on population factors show that linkage disequilibrium methodology enables to get better results of imputation than with equidistant methodology.
- Published
- 2018
9. Statistical Methods to Identify Local Adaptation in Continuous and Admixed Populations
- Author
-
MARTINS, Helena, STAR, ABES, Techniques de l'Ingénierie Médicale et de la Complexité - Informatique, Mathématiques et Applications, Grenoble - UMR 5525 (TIMC-IMAG), Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), Université Grenoble Alpes, Olivier François, and Michaël Blum
- Subjects
Biostatistiques ,[SDV.GEN.GPO]Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,Scan génomique ,Population genetics ,Tests de différenciation des populations ,Admixed populations ,Biostatistics ,Déséquilibre de liaison ,Génétique des populations ,Linkage disequilibrium ,[SDV.GEN.GPO] Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,Population differentiation tests ,Genome scan for selection ,Populations mélangées - Abstract
Finding genetic signatures of local adaptation is of great interest for many population genetic studies. Common approaches to sorting selective loci from their genomic background focus on the extreme values of the fixation index, FST, across loci. However, the computation of the fixation index becomes challenging when the population is genetically continuous, when predefining subpopulations is a difficult task, and in the presence of admixed individuals in the sample. In this thesis, we present a new method to identify loci under selection based on an extension of the FST statistic to samples with admixed individuals. Considering our goal of exploring statistical methods to identify local adaptation in admixed population, we included spatial data to compute ancestry coefficients and allele frequencies. To enrich our work, we investigated the effects of linkage disequilibrium and LD-pruning methods in genome scans for selection., La recherche des signatures génétiques de l'adaptation locale est d'un grand intérêt pour de nombreuses études de génétique des populations. Les approches pour trier les loci sélectifs à partir de leur contexte génomique, se concentrent sur les valeurs extrêmes de l'indice de fixation, FST, à travers les loci. Cependant, le calcul de l'indice de fixation devient difficile lorsque la population est génétiquement continue, lorsque la prédéfinition des sous-populations est une tâche difficile et en présence d'individus mélangés dans l'échantillon. Dans cette thèse, nous présentons une nouvelle méthode pour identifier les loci sous sélection basée sur une extension de la statistique FST à des échantillons avec des individus mélangés. Considérant notre objectif d'explorer des méthodes statistiques pour identifier l'adaptation locale dans la population mélangée, nous avons inclus des données spatiales pour calculer les coefficients d'ascendance et les fréquences d'allèles. Pour enrichir notre travail, nous avons investigué les effets du déséquilibre de liaison et des méthodes d'élagage de LD dans les analyses de génomes pour la sélection.
- Published
- 2018
10. Design of low density SNP chips for genotype imputation in layer chicken
- Author
-
Sophie Allais, Pascale Le Roy, Amandine Varenne, David Picard Druet, Thierry Burlot, Florian Herry, Frédéric Hérault, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), Novogen, ANR-10-GENOM_BTV-015 UtOpIGe, and AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA)
- Subjects
0301 basic medicine ,Linkage disequilibrium ,laying hen ,fréquence allélique ,Gene Frequency ,Statistics ,déséquilibre de liaison ,Genetics (clinical) ,Oligonucleotide Array Sequence Analysis ,Genetics ,Animal biology ,education.field_of_study ,degré de parenté ,[SDV.BA]Life Sciences [q-bio]/Animal biology ,évaluation génomique ,MAF ,SNP genotyping ,Genetic gain ,allele frequency ,Research Article ,Degree of kinship ,polymorphisme nucléotidique simple (SNP) ,lcsh:QH426-470 ,Genotype ,caractérisation génomique ,Population ,Layer chickens ,Biology ,Polymorphism, Single Nucleotide ,Chromosomes ,Imputation accuracy ,03 medical and health sciences ,Biologie animale ,Animals ,SNP ,education ,Genotyping ,précision de sélection ,SNP density ,poule pondeuse ,Minor allele frequency ,lcsh:Genetics ,030104 developmental biology ,génotypage ,Low density chip ,Chickens ,Imputation (genetics) - Abstract
Background[br/] The main goal of selection is to achieve genetic gain for a population by choosing the best breeders among a set of selection candidates. Since 2013, the use of a high density genotyping chip (600K Affymetrix (R) Axiom (R) HD genotyping array) for chicken has enabled the implementation of genomic selection in layer and broiler breeding, but the genotyping costs remain high for a routine use on a large number of selection candidates. It has thus been deemed interesting to develop a low density genotyping chip that would induce lower costs. In this perspective, various simulation studies have been conducted to find the best way to select a set of SNPs for low density genotyping of two laying hen lines.[br/] Results[br/] To design low density SNP chips, two methodologies, based on equidistance (EQ) or on linkage disequilibrium (LD) were compared. Imputation accuracy was assessed as the mean correlation between true and imputed genotypes. The results showed correlations more sensitive to false imputation of SNPs having low Minor Allele Frequency (MAF) when the EQ methodology was used. An increase in imputation accuracy was obtained when SNP density was increased, either through an increase in the number of selected windows on a chromosome or through the rise of the LD threshold. Moreover, the results varied depending on the type of chromosome (macro or micro-chromosome). The LD methodology enabled to optimize the number of SNPs, by reducing the SNP density on macro-chromosomes and by increasing it on micro-chromosomes. Imputation accuracy also increased when the size of the reference population was increased. Conversely, imputation accuracy decreased when the degree of kinship between reference and candidate populations was reduced. Finally, adding selection candidates' dams in the reference population, in addition to their sire, enabled to get better imputation results.[br/] Conclusions[br/] Whichever the SNP chip, the methodology, and the scenario studied, highly accurate imputations were obtained, with mean correlations higher than 0.83. The key point to achieve good imputation results is to take into account chicken lines' LD when designing a low density SNP chip, and to include the candidates' direct parents in the reference population.
- Published
- 2018
- Full Text
- View/download PDF
11. A linkage disequilibrium study in layers and broiler commercial chicken populations
- Author
-
Hérault, Frédéric, HERRY, Florian, Varenne, Amandine, Burlot, Thierry, Picard--Druet, David, Recoquillay, Julien, Macé, Camille, Fagnoul, Frédéric, Allais, Sophie, Le Roy, Pascale, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA), Novogen, Hubbard, ANR-10-GENOM_BTV-015 UtOpIGe, ANR-10-GENM-0015,UtOpIGe,Vers une Utilisation Optimale de l'Information Génomique dans les schémas pyramidaux(2010), Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), AGROCAMPUS OUEST, and Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de la Recherche Agronomique (INRA)
- Subjects
Animal biology ,polymorphisme nucléotidique simple (SNP) ,broilers ,[SDV.BA]Life Sciences [q-bio]/Animal biology ,layer ,broiler ,linkage disequilibrium ,génome ,Biologie animale ,déséquilibre de liaison ,poulet de chair - Abstract
Knowledge of the linkage disequilibrium (LD) pattern is useful in animal genetic studies as it underlies mapping studies and genomic selection. Recently, the availability of the high density 600K Affymetrix® Axiom® HD SNP genotyping array allows to asses a higher resolution of the LD structure in chicken genome. In this study, we analysed genotypes of 1541 animals from layers and broiler commercial populations to characterize their LD pattern. LD was measured by the average r2 value at a given physical distance between SNP. LD extends over a larger region for layers line than for broiler line. Most differences between lines appeared at small interval distance (< 0.5Mb). LD extent and decay differed considerably between chromosome categories. Average r2 values were higher for Z chromosome than for macro, intermediates and microchromosomes. The extent of useful LD observed for autosomal chromosomes is at least tenfold longer for layers line than for broiler. Finally, this study shed light on high LD for the Z chromosome. The differences in LD pattern observed between chromosomes and chicken lines should be taken into account to define an economically efficient genotyping strategy.
- Published
- 2018
12. Modélisation du déséquilibre de liaison en génomique des populations par méthodes d'optimisation
- Author
-
Dias Alves, Thomas, Techniques de l'Ingénierie Médicale et de la Complexité - Informatique, Mathématiques et Applications, Grenoble - UMR 5525 (TIMC-IMAG), Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), Université Grenoble Alpes, Michaël Blum, Julien Mairal, and STAR, ABES
- Subjects
Optimization ,Linkage disequillibrium ,[SDV.GEN.GPO]Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST] ,[SDV.GEN.GPO] Life Sciences [q-bio]/Genetics/Populations and Evolution [q-bio.PE] ,Haplotype ,Optimisation ,[MATH.MATH-ST] Mathematics [math]/Statistics [math.ST] ,Déséquilibre de liaison - Abstract
We present a new formalism and new methods to model linkage disequilibrium and to account for haplotype structure of population genomics data. Modeling relies on an optimization problem with constraints that is solved using dynamic programming. The algorithmic cost of proposed methods is linear, which is a desirable property to process large datasets.First, we applied our framework to study admixed populations and perform local ancestry inference. Our method is applied to simulated genotypes of admixed human populations and to real genotypes from admixed Populus species.Second, we developed our optimization framework to perform haploptype phasing and imputation based on a population of genotypes. All optimization methods have been developed in a Python package called Loter., Nous présentons un nouveau formalisme et des nouvelles méthodes pour modéliser le déséquilibre de liaison et tenir compte de la structure en haplotypes pour les données issues de la génomique des populations. La modélisation repose sur un problème d'optimisation avec contraintes qui est résolue avec un algorithme de programmation dynamique. Les méthodes établies ont toutes l'avantage d'avoir un coût algorithmique linéaire et donc de pouvoir traiter de grands jeux de données.Dans un premier temps, nous avons appliqué notre approche à l'étude des populations métisses et plus particulièrement au problème d'inférence des coefficients de métissage locaux.Notre méthode a été appliquée à des génotypes simulés de métissage humain ainsi qu'à des vrais génotypes obtenus dans des populations métisses de peupliers.Dans un second temps, nous avons développé notre formalisme d'optimisation pour traiter de l'inférence des haplotypes à partir des génotypes d'une population.L'ensemble de ces méthodes d'optimisation a été développé dans un module Python qui s'appelle Loter.
- Published
- 2017
13. Select SNP 4 Imputation (SS4I) : un outil simple de sélection de SNP en fonction du DL
- Author
-
Herault, Frédéric, Yon, Jérémy, Herry, Florian, Allais, Sophie, Le Roy, Pascale, Physiologie, Environnement et Génétique pour l'Animal et les Systèmes d'Elevage [Rennes] (PEGASE), AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de la Recherche Agronomique (INRA), and AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA)
- Subjects
polymorphisme nucléotidique simple (SNP) ,outil informatique ,génotypage ,génome ,[SDV]Life Sciences [q-bio] ,gallus gallus ,imputation ,déséquilibre de liaison - Abstract
Métaprogramme Selgen; Select SNP 4 Imputation (SS4I) : un outil simple de sélection de SNP en fonction du DL. Réunion du projet Selgen INCoMINGS
- Published
- 2016
14. Detecting molecular footprint of local adaptation in Zymoseptoria tritici
- Author
-
Genissel, Anne, Gout, Lilian, BIOlogie et GEstion des Risques en agriculture (BIOGER), and Institut National de la Recherche Agronomique (INRA)-AgroParisTech
- Subjects
Zymoseptoria tritici ,natural populations ,genetic differentiation ,adaptation ,linkage disequilibrium ,populations naturelles ,differenciation genetique ,desequilibre de liaison ,[SDV]Life Sciences [q-bio] - Abstract
National audience; Zymoseptoria tritici (Zt) is one of the most common pathogen of wheat and yet the genetic basis ofadaptation in this species is largely unknown. Population genetics studies using neutral markers suggest for the most part that there is a low level of genetic differentiation between natural population samples in Zt. Using new generation sequencing data, now we can provide an in depth analysis of the genetic variation segregating in natural populations, and better understand the mode and tempo of genome evolution at the intraspecific level. The aim of this work was to identify the genes / genome regions that are under extreme genetic differentiation between two French population samples that differ in environment, collected in the North and South of France. To reach this goal, we used new generation sequencing data from 30 isolates. We found a large genetic diversity for both single nucleotide polymorphisms and structural variants within and between population samples. Many polymorphic sites throughout the genome were highly differentiated between the population samples, especially we discovered a large inversion on chromosome 7. We detailed the nature of geneticvariants in this specific region. We also described the pattern of linkage disequilibrium and quantify the skew in allele frequency spectrum across inverted regions to understand the nature of the selection in action. Last, we discuss the potential role of inversions in local adaptation.
- Published
- 2016
15. On the accuracy of genomic selection
- Author
-
Charles-Elie Rabier, Torben Asp, Brigitte Mangin, Philippe Barre, Gilles Charmet, Unité de Mathématiques et Informatique Appliquées de Toulouse (MIAT INRA), Institut National de la Recherche Agronomique (INRA), Unité de Recherche Pluridisciplinaire Prairies et Plantes Fourragères (P3F), Department of Molecular Biology and Genetics, Al-Farabi Kazakh National University [Almaty] (KazNU), Génétique Diversité et Ecophysiologie des Céréales (GDEC), Institut National de la Recherche Agronomique (INRA)-Université Blaise Pascal - Clermont-Ferrand 2 (UBP), Laboratoire des interactions plantes micro-organismes (LIPM), Institut National de la Recherche Agronomique (INRA)-Centre National de la Recherche Scientifique (CNRS), Projet CROPDL, Metaprogramme INRA SELGEN, Al-Farabi Kazakh National University, and Centre National de la Recherche Scientifique (CNRS)-Institut National de la Recherche Agronomique (INRA)
- Subjects
0301 basic medicine ,[SDV.SA]Life Sciences [q-bio]/Agricultural sciences ,Linkage disequilibrium ,Economics ,Economic Models ,Social Sciences ,Plant Weeds ,lcsh:Medicine ,Genome-wide association study ,Breeding ,marqueur ,Linkage Disequilibrium ,genomic selection ,Mathematical and Statistical Techniques ,Statistics ,déséquilibre de liaison ,Proxy (statistics) ,lcsh:Science ,Genetics ,Multidisciplinary ,Simulation and Modeling ,qtl ,Regression analysis ,Genomics ,Plants ,exactness ,Agricultural sciences ,Phenotype ,Physical Sciences ,Statistics (Mathematics) ,Research Article ,exactitude ,True breeding organism ,Population Size ,Quantitative Trait Loci ,Context (language use) ,Quantitative trait locus ,Biology ,Research and Analysis Methods ,Polymorphism, Single Nucleotide ,03 medical and health sciences ,Population Metrics ,Effective Population Size ,Genome-Wide Association Studies ,Grasses ,Statistical Methods ,Selection, Genetic ,sélection génomique ,Selection (genetic algorithm) ,marker ,Evolutionary Biology ,Population Biology ,lcsh:R ,Organisms ,Biology and Life Sciences ,Computational Biology ,Human Genetics ,Models, Theoretical ,Genome Analysis ,030104 developmental biology ,Genetic Loci ,lcsh:Q ,Ryegrass ,Mathematics ,Population Genetics ,Sciences agricoles ,Forecasting - Abstract
Genomic selection is focused on prediction of breeding values of selection candidates by means of high density of markers. It relies on the assumption that all quantitative trait loci (QTLs) tend to be in strong linkage disequilibrium (LD) with at least one marker. In this context, we present theoretical results regarding the accuracy of genomic selection, i.e., the correlation between predicted and true breeding values. Typically, for individuals (so-called test individuals), breeding values are predicted by means of markers, using marker effects estimated by fitting a ridge regression model to a set of training individuals. We present a theoretical expression for the accuracy; this expression is suitable for any configurations of LD between QTLs and markers. We also introduce a new accuracy proxy that is free of the QTL parameters and easily computable; it outperforms the proxies suggested in the literature, in particular, those based on an estimated effective number of independent loci (Me ). The theoretical formula, the new proxy, and existing proxies were compared for simulated data, and the results point to the validity of our approach. The calculations were also illustrated on a new perennial ryegrass set (367 individuals) genotyped for 24,957 single nucleotide polymorphisms (SNPs). In this case, most of the proxies studied yielded similar results because of the lack of markers for coverage of the entire genome (2.7 Gb).
- Published
- 2016
- Full Text
- View/download PDF
16. Spatial Clustering of Linkage Disequilibrium blocks for Genome-Wide Association Studies
- Author
-
Dehman, Alia, Laboratoire de Mathématiques et Modélisation d'Evry, Institut National de la Recherche Agronomique (INRA)-Université d'Évry-Val-d'Essonne (UEVE)-Centre National de la Recherche Scientifique (CNRS), Université d'Evry Val d'Essonne, Université Paris-Saclay, Christophe Ambroise(christophe.ambroise@genopole.cnrs.fr), Pierre Neuvial(pierre.neuvial@genopole.cnrs.fr), Laboratoire de Mathématiques et Modélisation d'Evry (LaMME), Institut National de la Recherche Agronomique (INRA)-Université d'Évry-Val-d'Essonne (UEVE)-ENSIIE-Centre National de la Recherche Scientifique (CNRS), Institut National de la Recherche Agronomique (INRA) - Université d'Evry-Val d'Essonne - ENSIIE - Centre National de la Recherche Scientifique (CNRS), and Dehman, Alia
- Subjects
[SDV.GEN]Life Sciences [q-bio]/Genetics ,Penalized regression ,Classification hiérarchique ,[SDV.GEN] Life Sciences [q-bio]/Genetics ,Model selection ,Linkage Disequilibrium ,Hierarchical clustering ,Gap statistic ,Déséquilibre de liaison ,[STAT] Statistics [stat] ,Sélection de modèle ,[STAT]Statistics [stat] ,Group lasso ,Genome-Wide Association Studies ,Régression pénalisée - Abstract
With recent development of high-throughput genotyping technologies, the usage of Genome-Wide Association Studies (GWAS) has become widespread in genetic research. By screening large portions of the genome, these studies aim to characterize genetic factors involved in the development of complex genetic diseases.GWAS are also based on the existence of statistical dependencies, called Linkage Disequilibrium (LD) usually observed between nearby loci on DNA. LD is defined as the non-random association of alleles at different loci on the same chromosome or on different chromosomes in a population. This biological feature is of fundamental importance in association studies as it provides a fine location of unobserved causal mutations using adjacent genetic markers. Nevertheless, the complex block structure induced by LD as well as the large volume of genetic data are key issues that have arisen with GWA studies.The contributions presented in this manuscript are in twofold, both methodological and algorithmic. On the methodological part, we propose a three-step approach that explicitly takes advantage of the grouping structure induced by LD in order to identify common variants which may have been missed by single marker analyses. In the first step, we perform a hierarchical clustering of SNPs with an adjacency constraint using LD as a similarity measure. In the second step, we apply a model selection approach to the obtained hierarchy in order to define LD blocks. Finally, we perform Group Lasso regression on the inferred LD blocks. The efficiency of the proposed approach is investigated compared to state-of-the art regression methods on simulated, semi-simulated and real GWAS data.On the algorithmic part, we focus on the spatially-constrained hierarchical clustering algorithm whose quadratic time complexity is not adapted to the high-dimensionality of GWAS data. We then present, in this manuscript, an efficient implementation of such an algorithm in the general context of any similarity measure. By introducing a user-parameter h and using the min-heap structure, we obtain a sub-quadratic time complexity of the adjacency-constrained hierarchical clustering algorithm, as well as a linear space complexity in the number of items to be clustered. The interest of this novel algorithm is illustrated in GWAS applications., Avec le développement récent des technologies de génotypage à haut débit, l'utilisation des études d'association pangénomiques (GWAS) est devenue très répandue dans la recherche génétique. Au moyen de criblage de grandes parties du génome, ces études visent à caractériser les facteurs génétiques impliqués dans le développement de maladies génétiques complexes.Les GWAS sont également basées sur l'existence de dépendances statistiques, appelées déséquilibre de liaison(DL), habituellement observées entre des loci qui sont proches dans l'ADN. Le DL est défini comme l'association non aléatoire d'allèles à des loci différents sur le même chromosome ou sur des chromosomes différents dans unepopulation. Cette caractéristique biologique est d'une importance fondamentale dans les études d'association car elle permetla localisation précise des mutations causales en utilisant les marqueurs génétiques adjacents. Néanmoins, la structure de blocs complexe induite par le DL ainsi que le grand volume de données génétiques constituent les principaux enjeux soulevés par les études GWAS.Les contributions présentées dans ce manuscrit comportent un double aspect, à la fois méthodologique et algorithmique. Sur le plan méthodologie, nous proposons une approche en trois étapes qui tire profit de la structure de groupes induite par le DL afin d'identifier des variants communs qui pourraient avoir été manquées par l'analyse simple marqueur. Dans une première étape, nous effectuons une classification hiérarchique des SNPs avec une contrainte d'adjacence et en utilisant le DL comme mesure de similarité. Dans une seconde étape, nous appliquons une approche de sélection de modèle à la hiérarchie obtenue afin de définir des blocs de DL. Enfin, nous appliquons le modèle de régression Group Lasso sur les blocs de DLinférés. L'efficacité de l'approche proposée est comparée à celle des approches de régression standards sur des données simulées, semi-simulées et réelles de GWAS.Sur le plan algorithmique, nous nous concentrons sur l'algorithme de classification hiérarchique avec contrainte spatiale dont la complexité quadratique en temps n'est pas adaptée à la grande dimension des données GWAS. Ainsi, nous présentons, dans ce manuscrit, une mise en œuvre efficace d'un tel algorithme dans le contexte général de n'importe quelle mesure de similarité. En introduisant un paramètre $h$ défini par l'utilisateur et en utilisant la structure de tas-min, nous obtenons une complexité sous-quadratique en temps de l'algorithme de classification hiérarchie avec contrainte d'adjacence, ainsi qu'une complexité linéaire en mémoire en le nombre d'éléments à classer. L'intérêt de ce nouvel algorithme est illustré dans des applications GWAS.
- Published
- 2015
17. Optimization of statistical methods for QTL detection
- Author
-
Jacquin, Laval, Génétique Physiologie et Systèmes d'Elevage (GenPhySE ), École nationale supérieure agronomique de Toulouse [ENSAT]-Institut National de la Recherche Agronomique (INRA)-Ecole Nationale Vétérinaire de Toulouse (ENVT), Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées, Institut National Polytechnique (Toulouse), Elsen Jean-Michel, Gilbert Hélène, Institut National Polytechnique de Toulouse - INPT (FRANCE), Station d'Amélioration Génétique des Animaux (SAGA), Institut National de la Recherche Agronomique (INRA), and Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE)
- Subjects
haplotypes ,locus à effet quantitatif ,ld ,[SDV]Life Sciences [q-bio] ,Haplotypes ,liaison ,Locus à effets quantitatifs (QTL) ,Déséquilibre de liaison (LD) ,Association ,Robustesse statistique ,STATISQUES ,[INFO]Computer Science [cs] ,déséquilibre de liaison ,ComputingMilieux_MISCELLANEOUS ,Distance matricielle ,robustesse statistique ,Liaison ,VARIABILITE ,qtl ,puissance statistique ,association ,distance matricielle ,Puissance statistique ,GENOMIQUE ,METHODES - Abstract
L’avènement du génotypage à haut débit permet aujourd’hui de mieux exploiter le phénomène d’association, appelé déséquilibre de liaison (LD), qui existe entre les allèles de différents loci sur le génome. Dans ce contexte, l’utilité de certains modèles utilisés en cartographie de locus à effets quantitatifs (QTL) est remise en question. Les objectifs de ce travail étaient de discriminer entre des modèles utilisés en routine en cartographie et d’apporter des éclaircissements sur la meilleure façon d’exploiter le LD, par l’utilisation d’haplotypes, afin d’optimiser les modèles basés sur ce concept. On montre que les modèles uni-marqueur de liaison, développés en génétique il y a vingtaine d’années, comportent peu d’intérêts aujourd’hui avec le génotypage à haut débit. Dans ce contexte, on montre que les modèles uni-marqueur d’association comportent plus d’avantages que les modèles uni-marqueur de liaison, surtout pour des QTL ayant un effet petit ou modéré sur le phénotype, à condition de bien maîtriser la structure génétique entre individus. Les puissances et les robustesses statistiques de ces modèles ont été étudiées, à la fois sur le plan théorique et par simulations, afin de valider les résultats obtenus pour la comparaison de l’association avec la liaison. Toutefois, les modèles uni-marqueur ne sont pas aussi efficaces que les modèles utilisant des haplotypes dans la prise en compte du LD pour une cartographie fine de QTL. Des propriétés mathématiques reliées à la cartographie de QTL par l’exploitation du LD multiallélique capté par les modèles haplotypiques ont été explicitées et étudiées à l’aide d’une distance matricielle définie entre deux positions sur le génome. Cette distance a été exprimée algébriquement comme une fonction des coefficients du LD multiallélique. Les propriétés mathématiques liées à cette fonction montrent qu’il est difficile de bien exploiter le LD multiallélique, pour un génotypage à haut débit, si l’on ne tient pas compte uniquement de la similarité totale entre des haplotypes. Des études sur données réelles et simulées ont illustré ces propriétés et montrent une corrélation supérieure à 0.9 entre une statistique basée sur la distance matricielle et des résultats de cartographie. Cette forte corrélation a donné lieu à la proposition d’une méthode, basée sur la distance matricielle, qui aide à discriminer entre les modèles utilisés en cartographie.
- Published
- 2014
18. La consanguinité à l'ère du génome haut-débit : estimations et applications
- Author
-
Gazal, Steven, Variabilité Génétique et Maladies Humaines, Institut Universitaire d'Hématologie (IUH), Université Paris Diderot - Paris 7 (UPD7)-Université Paris Diderot - Paris 7 (UPD7)-Institut National de la Santé et de la Recherche Médicale (INSERM), Université Paris Sud - Paris XI, Emmanuelle Génin, and STAR, ABES
- Subjects
Hidden Markov model ,Consanguinité ,Population genetics ,Génétique épidémiologique ,Génétique statistique ,Homozygotie-par-descendance ,Alzheimer's disease ,Comparison of methods ,Maladie d’Alzheimer ,Déséquilibre de liaison ,HapMap ,Consanguinity ,Génétique des populations ,[SDV.SPEE] Life Sciences [q-bio]/Santé publique et épidémiologie ,Homozygosity mapping ,Comparaison de méthodes ,Linkage disequilibrium ,Cartographie par homozygotie ,Genetic epidemiology ,[SDV.SPEE]Life Sciences [q-bio]/Santé publique et épidémiologie ,Homozygosity-by-descent ,Chaine de Markov cachée ,Statistical genetics - Abstract
An individual is said to be inbred if his parents are related and if his genealogy contains at least one inbreeding loop leading to a common ancestor. The inbreeding coefficient of an individual is defined as the probability that the individual has received two alleles identical by descent, coming from a single allele present in a common ancestor, at a random marker on the genome. The inbreeding coefficient is a central parameter in genetics, and is used in population genetics to characterize the population structure, and also in genetic epidemiology to search for genetic factors involved in recessive diseases.The inbreeding coefficient was traditionally estimated from genealogies, but methods have been developed to avoid genealogies and to estimate this coefficient from the information provided by genetic markers distributed along the genome.With the advances in high-throughput genotyping techniques, it is now possible to genotype hundreds of thousands of markers for one individual, and to use these methods to reconstruct the regions of identity by descent on his genome and estimate a genomic inbreeding coefficient. There is currently no consensus on the best strategy to adopt with these dense marker maps, in particular to take into account dependencies between alleles at different markers (linkage disequilibrium).In this thesis, we evaluated the different available methods through simulations using real data with realistic patterns of linkage disequilibrium. We highlighted an interesting approach that consists in generating several submaps to minimize linkage disequilibrium, estimating an inbreeding coefficient of each of the submaps based on a hidden Markov method implemented in FEstim software, and taking as estimator the median of these different estimates. The advantage of this approach is that it can be used on any sample size, even on an individual, since it requires no linkage disequilibrium estimate. FEstim is a maximum likelihood estimator, which allows testing whether the inbreeding coefficient is significantly different from zero and determining the most probable mating type of the parents. Finally, through the identification of homozygous regions shared by several consanguineous patients, our strategy permits the identification of recessive mutations involved in monogenic and multifactorial diseases.To facilitate the use of our method, we developed the pipeline FSuite, to interpret results of population genetics and genetic epidemiology studies, as shown on the HapMap III reference panel, and on a case-control Alzheimer's disease data., Un individu est dit consanguin si ses parents sont apparentés et s’il existe donc dans sa généalogie au moins une boucle de consanguinité aboutissant à un ancêtre commun. Le coefficient de consanguinité de l’individu est par définition la probabilité pour qu’à un point pris au hasard sur le génome, l’individu ait reçu deux allèles identiques par descendance qui proviennent d’un seul allèle présent chez un des ancêtres communs. Ce coefficient de consanguinité est un paramètre central de la génétique qui est utilisé en génétique des populations pour caractériser la structure des populations, mais également pour rechercher des facteurs génétiques impliqués dans les maladies. Le coefficient de consanguinité était classiquement estimé à partir des généalogies, mais des méthodes ont été développées pour s’affranchir des généalogies et l’estimer à partir de l’information apportée par des marqueurs génétiques répartis sur l’ensemble du génome.Grâce aux progrès des techniques de génotypage haut-débit, il est possible aujourd’hui d’obtenir les génotypes d’un individu sur des centaines de milliers de marqueurs et d’utiliser ces méthodes pour reconstruire les régions d’identité par descendance sur son génome et estimer un coefficient de consanguinité génomique. Il n’existe actuellement pas de consensus sur la meilleure stratégie à adopter sur ces cartes denses de marqueurs en particulier pour gérer les dépendances qui existent entre les allèles aux différents marqueurs (déséquilibre de liaison). Dans cette thèse, nous avons évalué les différentes méthodes disponibles à partir de simulations réalisées en utilisant de vraies données avec des schémas de déséquilibre de liaison réalistes. Nous avons montré qu’une approche intéressante consistait à générer plusieurs sous-cartes de marqueurs dans lesquelles le déséquilibre de liaison est minimal, d’estimer un coefficient de consanguinité sur chacune des sous-cartes par une méthode basée sur une chaîne de Markov cachée implémentée dans le logiciel FEstim et de prendre comme estimateur la médiane de ces différentes estimations. L’avantage de cette approche est qu’elle est utilisable sur n’importe quelle taille d’échantillon, voire sur un seul individu, puisqu’elle ne demande pas d’estimer les déséquilibres de liaison. L’estimateur donné par FEstim étant un estimateur du maximum de vraisemblance, il est également possible de tester si le coefficient de consanguinité est significativement différent de zéro et de déterminer la relation de parenté des parents la plus vraisemblable parmi un ensemble de relations. Enfin, en permettant l’identification de régions d’homozygoties communes à plusieurs malades consanguins, notre stratégie peut permettre l’identification des mutations récessives impliquées dans les maladies monogéniques ou multifactorielles.Pour que la méthode que nous proposons soit facilement utilisable, nous avons développé le pipeline, FSuite, permettant d’interpréter facilement les résultats d’études de génétique de populations et de génétique épidémiologique comme illustré sur le panel de référence HapMap III, et sur un jeu de données cas-témoins de la maladie d’Alzheimer.
- Published
- 2014
19. Applications du processus ancestral avec recombinaison et conversion en génétique statistique
- Author
-
Saidi, Lamiae and Lessard, Sabin
- Subjects
recombinaison ,Ancestral process ,processus ancestral ,variabilité génétique ,genetic variability ,coalescent ,conversion ,déséquilibre de liaison ,modèle de Moran ,Moran model ,linkage disequilibrium ,recombination - Abstract
Le processus ancestral est appliqué pour étudier la variabilité génétique et la mesure de déséquilibre de liaison de séquences d’ADN, et faire de l’inférence statistique sur les divers facteurs responsables de cette variabilité. En tenant compte, en premier lieu, des facteurs de dérive génétique, de mutation, et de recombinaison, les calculs exacts de la mesure de déséquilibre de liaison de deux loci sont retrouvés. De plus, une approximation du processus exact, SMC (sequentially Markov chain), est utilisée pour trouver la mesure d’association à deux loci, et une formule de covariance pour calculer cette mesure est corrigée. En intégrant le facteur de conversion dans le modèle de Moran, on trouve l’espérance des mesures de polymorphisme exprimées par les espérances des mesures de variation intra-locus et inter-locus. Celles-ci sont calculées à l’aide de temps espérés dans les états ancestraux. De plus, l’espérance du déséquilibre de liaison est trouvée et il est montré qu’elle diminue quand le taux de recombinaison augmente. En utilisant ces résultats théoriques, on présente une méthode pour estimer les paramètres de mutation, de recombinaison, et de conversion., The ancestral process is applied to investigate the amount of DNA variation and the amount of linkage disequilibrium ; it is also applied to make statistical inference about the multiple factors responsible for this variation. Considering genetic drift, mutation, and recombination events, the exact solutions for linkage disequilibrium between two loci are obtained. Furthermore, the association measure between two loci is obtained by using an approximation of the exact process, SMC (sequentially Markov chain), and correcting a covariance formula. After introducing intrachromosomal gene conversion under the Moran model, the expected amounts of variation within and between two loci are obtained using expected times spent in the ancestral states. Furthermore, the expectation of linkage disequilibrium is obtained and it is shown to decrease as the recombination rate is increased. Using these theoretical results, a method for estimating the mutation, recombination and gene conversion parameters is presented., Les diagrammes de transitions d'états ont été réalisés avec le logiciel Latex.
- Published
- 2014
20. Genome-wide distribution of genetic diversity and linkage disequilibrium in a mass-selected population of maritime pine
- Author
-
Fikret Isik, Laurent Bouffier, Jean-Baptiste Lamy, Eric Mandrou, Jeffrey B. Endelman, Marco C. A. M. Bink, Joost van Heerwaarden, Christophe Plomion, François Ehrenmann, Isabelle Lesur, Emilie Chancerel, Biodiversité, Gènes & Communautés (BioGeCo), Institut National de la Recherche Agronomique (INRA)-Université de Bordeaux (UB), University of Wisconsin-Madison, HelixVenture, Department of Forestry and Environmental Resources, North Carolina State University [Raleigh] (NC State), University of North Carolina System (UNC)-University of North Carolina System (UNC), Biometris, and Wageningen University and Research [Wageningen] (WUR)
- Subjects
Linkage disequilibrium ,Genotyping Techniques ,Genetic Linkage ,[SDV]Life Sciences [q-bio] ,Pinus pinaster ,polymorphisme ,cryptomeria-japonica ,marqueur ,Wiskundige en Statistische Methoden - Biometris ,Linkage Disequilibrium ,Genetic diversity ,Population genomics ,Domestication ,Effective population size ,Gene Frequency ,déséquilibre de liaison ,Association mapping ,Genetics ,education.field_of_study ,Linkage map ,Chromosome Mapping ,domestication des espèces ,Genomics ,PE&RC ,Biometris ,Plant Production Systems ,diversité génétique ,Genetic structure ,Algorithms ,Genome, Plant ,expression des gènes ,Biotechnology ,Research Article ,Genotype ,Population ,Forest tree ,Outcrossing ,Biology ,Polymorphism, Single Nucleotide ,white spruce ,complex traits ,loblolly-pine ,cloned population ,education ,Mathematical and Statistical Methods - Biometris ,Genomic selection ,multilocus genotype data ,consensus map ,Genetic Variation ,15. Life on land ,Pinus ,Breeding program ,Recombination ,genetic diversity ,linkage disequilibrium ,recombination ,linkage map ,domestication ,breeding program ,forest tree ,genomics ,genomic selection ,density-estimation ,Evolutionary biology ,Plantaardige Productiesystemen ,breeding values ,cartographie ,forest trees - Abstract
The accessibility of high-throughput genotyping technologies has contributed greatly to the development of genomic resources in non-model organisms. High-density genotyping arrays have only recently been developed for some economically important species such as conifers. The potential for using genomic technologies in association mapping and breeding depends largely on the genome wide patterns of diversity and linkage disequilibrium in current breeding populations. This study aims to deepen our knowledge regarding these issues in maritime pine, the first species used for reforestation in south western Europe. Using a new map merging algorithm, we first established a 1,712 cM composite linkage map (comprising 1,838 SNP markers in 12 linkage groups) by bringing together three already available genetic maps. Using rigorous statistical testing based on kernel density estimation and resampling we identified cold and hot spots of recombination. In parallel, 186 unrelated trees of a mass-selected population were genotyped using a 12k-SNP array. A total of 2,600 informative SNPs allowed to describe historical recombination, genetic diversity and genetic structure of this recently domesticated breeding pool that forms the basis of much of the current and future breeding of this species. We observe very low levels of population genetic structure and find no evidence that artificial selection has caused a reduction in genetic diversity. By combining these two pieces of information, we provided the map position of 1,671 SNPs corresponding to 1,192 different loci. This made it possible to analyze the spatial pattern of genetic diversity (H e ) and long distance linkage disequilibrium (LD) along the chromosomes. We found no particular pattern in the empirical variogram of H e across the 12 linkage groups and, as expected for an outcrossing species with large effective population size, we observed an almost complete lack of long distance LD. These results are a stepping stone for the development of strategies for studies in population genomics, association mapping and genomic prediction in this economical and ecologically important forest tree species.
- Published
- 2014
- Full Text
- View/download PDF
21. Impact du choix de la méthode de prédiction d'identité d'allèles à des loci sur la précision en cartographie de QTL
- Author
-
Jacquin, Laval, Elsen, Jean Michel, Gilbert, Hélène, Station d'Amélioration Génétique des Animaux (SAGA), and Institut National de la Recherche Agronomique (INRA)
- Subjects
haplotype ,prédicteur d'identité allélique ,déséquilibre de liaison ,distance matricielle ,[SDV]Life Sciences [q-bio] ,ComputingMilieux_MISCELLANEOUS - Abstract
National audience
- Published
- 2013
22. La cartographie des sites de régulation génétique à partir de données de débalancement allélique
- Author
-
Vello, Emilio D. and Labuda, Damian
- Subjects
LD ,AI ,Déséquilibre de Liaison ,Regulatory Region ,Linkage disequilibrium ,SNP ,Allelic imbalance ,eQTL ,Région régulatrice ,Regulation - Abstract
En 1975, Wilson et King ont proposé que l'évolution opère non seulement via des changements affectant la structure des protéines, mais aussi via des mutations qui modifient la régulation génétique. L'étude des éléments régulateurs de l'expression génétique a un rôle important dans la compréhension de l'expression de différentes maladies et de la réponse thérapeutique. Nous avons développé un algorithme bio- informatique qui nous permet rapidement de trouver des sites de régulation génétique à travers tout le génome et pour une grande quantité de gènes. Notre approche consiste à trouver des sites polymorphes (SNPs) qui sont en déséquilibre de liaison avec le débalancement allélique (AI) afin de cartographier la région régulatrice et le site responsable. Notre méthode est avantageuse par rapport à d'autres méthodes, car elle n'a pas besoin des données « phasées». De plus, les données de débalancement allélique ne sont pas affectées par des facteurs externes étant donné qu'ils sont mesurés dans la même cellule. Nous avons démontré que notre approche est fiable et qu'elle peut détecter des sites loin du gène. De plus, il peut être appliqué à des données de génotypage sans avoir besoin de les « phaser » ., Wilson and King (1975) proposed that evolution frequently operates through mutations affecting genetic regulation. Likewise, it is expected that genetic variation responsible for inter-individual differences will be due to variation in regulatory sites. Identifying such sites is thus important in the genetic and medical research. We have developed a new bioinformatics algorithm to find genome-wide regulatory sites for a big number of genes. Individuals carrying different alleles at a regulatory site will exhibit allelic imbalance(AI) due to differential expression of the two copies the same locus. Our approach consists of searching polymorphic sites (SNPs) in linkage disequilibrium with AI in order to map regulatory regions. We have detected many SNPs associated to the regulation of different genes pointed in previous studies. We have also found regulatory regions far from the transcription start site (TSS). The major advantage of this method is that phased data is not needed. In addition, AI data has the benefit of not being affected by external factors since it is measured in the same cell. The results show that our approach is reliable and it can detect sites far from the gene.
- Published
- 2012
23. Haplotype tagging efficiency and tagSNP sets portability in worldwide populations in NAT2 gene
- Author
-
Sabbagh, Audrey, Darlu, Pierre, Langaney, André, and Poloni, Estella S.
- Subjects
association studies ,génétique des populations ,population genetics ,haplotype tagging ,déséquilibre de liaison ,études d’association ,NAT2 ,linkage disequilibrium ,ddc:599.9 ,marquage haplotypique - Abstract
Genetic polymorphism in the NAT2 gene is responsible for pronounced interindividual differences in the acetylation activity of the N-acetyltransferase 2 (NAT2) enzyme, which plays a crucial role in the metabolism of many clinically useful drugs and exogenous chemicals. Up to now, most association studies that have attempted to relate the acetylation phenotype in NAT2 to a variety of complex human disorders have led to contradictory results in different populations. Some of these inconsistencies may result from a poor knowledge of linkage patterns at NAT2 and their geographic variation. Using data from an extensive survey of the literature, we investigated the worldwide haplotype diversity and linkage disequilibrium structure of NAT2. For 28 population samples (including 3,994 individuals) from four continental regions (Africa, Europe, Asia, America), we evaluated haplotype tagging efficiency at NAT2 and defined population-specific sets of haplotype tagging SNPs (htSNPs) to be used for future association studies. Tagging common haplotypes yielded 2- to 3-fold savings in European and East Asian samples, while no gains from tagging were observed in samples of African ancestry, which displayed high haplotype diversity at NAT2. htSNPs sets appeared to be portable among populations from a same continent, provided that the continent-specific htSNPs sets were selected with a stringent criterion. A “cosmopolitan” htSNPs set suitable for all human populations could not be identified for the NAT2 gene, but a single four-htSNP set proved to perform successfully in all the non-African populations investigated. Le polymorphisme génétique du gène NAT2 est responsable de fortes différences interindividuelles de l’activité d’acétylation de l’enzyme N-acetyltransférase 2 (NAT2). Cette enzyme joue un rôle fondamental dans le métabolisme de nombreux xénobiotiques et médicaments utilisés en clinique. Jusqu’à présent, la plupart des études d’association qui ont tenté de relier les phénotypes d’acétylation du gène NAT2 à plusieurs maladies complexes chez l’homme ont conduit à des résultats contradictoires, essentiellement en raison des faibles connaissances sur la variation géographique des profils de déséquilibre de liaison au locus NAT2. C’est pourquoi nous avons entrepris une étude exhaustive de la littérature relatant la diversité mondiale haplotypique du gène NAT2 et décrivant les déséquilibres de liaison entre différents SNP (Single Nucleotide Polymorphism) de ce gène. Notre échantillon comprend 28 populations (incluant 3994 individus) réparties sur quatre continents (Afrique, Europe, Asie, Amérique). Pour chacune d’elles, nous avons estimé l’efficacité du marquage haplotypique (tagging) et défini le sous-ensemble de SNP (htSNP) qui s’avère juste nécessaire pour réaliser efficacement des études d’association. Ce marquage haplotypique permet de réduire d’un facteur 2 à 3 fois le nombre de SNP à étudier, du moins pour les populations d’Europe et d’Asie de l’Est. En revanche, la diversité haplotypique en Afrique est telle qu’aucune réduction n’est possible pour ce continent. Les marqueurs htSNP sélectionnés dans une population restent performants pour le continent dans lequel elle se situe, à la condition que les htSNP aient été sélectionnés avec un critère suffisamment « stringent ». Pour ce gène NAT2, il n’est pas possible d’identifier un unique ensemble de htSNP qui serait « universel » et efficace pour toutes les populations ; mais un ensemble réduit à seulement quatre htSNP reste parfaitement efficace dans le cas des populations non africaines.
- Published
- 2011
24. Recherche de marqueurs génétiques associés à la tolérance et/ou sensibilité des bovins aux trypanosomoses africaines
- Author
-
Dayo, Guiguigbaza-Kossigan
- Subjects
SELECTION ,DESEQUILIBRE DE LIAISON ,DIVERSITE GENETIQUE ,PHENOTYPE ,BOVIN ,GENETIQUE DE POPULATION ,MARQUEUR MICROSATELLITE ,CROISEMENT ,SENSIBILITE RESISTANCE ,LOCUS ,POLYMORPHISME GENETIQUE ,QTL.QUANTITATIVE TRAIT LOCUS ,TOLERANCE ,ZEBU ,TRYPANOSOMIASE ANIMALE ,IMMUNITE - Published
- 2009
25. Diversity of genetic resistance to South American Leaf Blight of rubber tree (Microcyclus ulei) assessed by QTL mapping and association genetics within natural populations
- Author
-
Le Guen, Vincent, Développement et amélioration des plantes (UMR DAP), Centre National de la Recherche Scientifique (CNRS)-Université Montpellier 2 - Sciences et Techniques (UM2)-Institut National de la Recherche Agronomique (INRA)-Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad), Université Montpellier II - Sciences et Techniques du Languedoc, and Brigitte Courtois
- Subjects
Résistance génétique ,Locus des caractères quantitatifs ,QTL ,Microcyclus ulei ,cartographie génétique ,microsatellites ,F30 - Génétique et amélioration des plantes ,Variation génétique ,Génétique des populations ,structure des populations ,génétique d'association ,[SDV.BV]Life Sciences [q-bio]/Vegetal Biology ,déséquilibre de liaison ,H20 - Maladies des plantes ,Hevea brasiliensis ,SALB ,Carte génétique - Abstract
South American Leaf Blight (SALB) caused by the fungus Microcyclus ulei is a serious threat to worldwide rubber tree cultivation and also responsible for the poor development of this culture in South and Central America. The breeding of resistant cultivars is considered as the best way to anticipate an accidental introduction of SALB in disease free countries and to develop rubber tree cultivation in diseased areas. The main resistance source described until now proved to be ineffective against the most aggressive fungus isolates. Another resistance source identified in a Peruvian cultivar holds for more than thirty years in high infestation conditions. Genetic mapping carried out on the progeny of a cross between this cultivar and a susceptible one revealed two major resistance genes, one located on linkage group g15 and effective against M. ulei isolates from French Guiana, and the other one on linkage group g13 effective against isolates from Bahia state (Brazil). Diversity analysis in South-West Amazonian natural populations shows populations structured in three main clusters corresponding to the Brazilian states of Acre, Rondônia and Mato Grosso. The Madre de Dios population in Peru is part of the Acre genetic cluster. Differentiation among populations is mainly explained by isolation by distance and secondarily by the existence of hydrographical basins. The linkage disequilibrium between linked neutral genetic markers is wider in Acre cluster than in Rondônia cluster, but remains low in both cases. A genetic association with the SALB resistant trait is detected with a microsatellite marker located close to the major resistance gene in linkage group g15. Another association is also detected in a genomic area where no resistant locus was expected until now. Importance of these results for breeding of new SALB resistant cultivars is discussed.; Menace potentielle pour l'hévéaculture mondiale, la maladie sud-américaine des feuilles de l'hévéa provoquée par le champignon Microcyclus ulei est aussi responsable du faible développement de cette culture en Amérique latine. La sélection de variétés résistantes est privilégiée pour anticiper une apparition accidentelle de la maladie dans les pays encore épargnés et pour développer la culture de l'hévéa dans les zones infestées. La principale source de résistance décrite jusqu'à présent n'est pas fonctionnelle face à des isolats très agressifs du champignon. Une autre source de résistance identifiée chez un cultivar originaire du Pérou se maintient depuis plus de trente ans en conditions de forte infestation. La cartographie génétique réalisée sur la descendance de ce cultivar en croisement révèle l'existence de deux gènes majeurs de résistance, l'un situé sur le groupe de liaison g15 et efficace contre les isolats de Guyane et l'autre sur le groupe de liaison g13 efficace vis-à-vis des isolats de l'état de Bahia. L'analyse de la diversité des populations naturelles du sud-ouest Amazonien fait apparaître une structure en trois groupes principaux recouvrant les états brésiliens de l'Acre, du Rondônia et du Mato Grosso. La population Madre de Dios au Pérou est rattachée au groupe de l'Acre. La différentiation entre les populations est expliquée principalement par l'isolement par la distance et secondairement par l'existence de bassins hydrographiques. Le déséquilibre de liaison entre marqueurs liés est plus étendu dans le groupe Acre que dans le groupe Rondônia, mais reste faible dans les deux cas. Une association avec le caractère de résistance à M. ulei est détectée avec un marqueur microsatellite situé à proximité du gène majeur de résistance du groupe de liaison g15. Une autre association est détectée dans une portion du génome où aucun locus de résistance n'était identifié jusqu'à présent. L'importance de ces résultats pour la sélection de nouveaux cultivars résistants à M. ulei est discutée.
- Published
- 2008
26. Recherche de déterminants génomiques impliqués dans l'hypertension, sur le chromosome X, chez des familles du Saguenay-Lac-Saint-Jean
- Author
-
Noël, Audrey, Hamet, Pavel, and Merlo, Ettore
- Subjects
Association ,Chromosome X ,Gènes ,Liaison ,Hypertension ,Déséquilibre de liaison ,SNPs - Abstract
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal.
- Published
- 2008
27. Structuration de la diversité génétique et analyse des patrons de déséquilibre de liaison de l'espèce Coffea canephora Pierre ex. Froehner
- Author
-
Cubry, Philippe, Développement et amélioration des plantes (UMR DAP), Centre National de la Recherche Scientifique (CNRS)-Université Montpellier 2 - Sciences et Techniques (UM2)-Institut National de la Recherche Agronomique (INRA)-Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad), Université Montpellier II - Sciences et Techniques du Languedoc, and Thierry Leroy(thierry.leroy@cirad.fr)
- Subjects
[SDV.EE]Life Sciences [q-bio]/Ecology, environment ,Coffea canephora Pierre ,population genetics ,génétique des populations ,genetic diversity ,études d'association ,F30 - Génétique et amélioration des plantes ,structure génétique ,Coffea canephora ,association studies ,diversité génétique ,genetic structure ,déséquilibre de liaison ,linkage disequilibrium - Abstract
The search for associations between molecular markers and variation of traits with agronomic importance is a main goal of Marker-Assisted Selection development, especially for perennials species. Knowledge of genetic diversity and structure is a prerequisite for such studies. In the same way, knowledge of structure and extant of Linkage Disequilibrium in populations is an important task. We strengthen and fine-tuned previously described genetic structure and diversity of Coffea canephora Pierre in order to assess the capabilities of association mapping based approaches for this species. We laid the basis for rapid characterization of genetic resources with the help of microsatellite markers and clarify the genetic origin of a previously nonstudied population. Future development of core-collections will benefit from these results. Structure and extent of Linkage Disequilibrium was determined at different scales and for different populations or genetic groups, with the help of 108 genome wide markers, giving the opportunities to identify suitable populations for the 2 assocation mapping categories, genome-wide scan and candidate region. A first try of association mapping confirms the important capabilities of such approaches for our species. Implications of genetic diversity and structure as well as Linkage Disequilibrium structure for future breeding purposes are discussed; La recherche d'associations entre marqueurs moléculaires et les variations de caractères d'intérêt agronomique est un enjeu majeur du développement de la sélection assistée par marqueurs, notamment pour des espèces pérennes. La connaissance de la diversité génétique et de la structure de celle-ci est un préalable indispensable à la mise en place de telles études. Au même titre, la connaissance de l'étendue et de l'intensité du déséquilibre de liaison au sein des populations considérées est également nécessaire. Nous avons donc entrepris de confirmer et de préciser la diversité et la structure génétique de Coffea canephora Pierre afin d'évaluer les potentialités d'études d'association sur cette espèce. Nous avons posé les bases d'une caractérisation rapide des collections de ressources génétiques de cette espèce à l'aide de marqueurs microsatellites et précisé l'origine génétique d'une population jusqu'à présent non étudiée. Cette base pourra également servir au développement de futures cores-collections. L'évaluation de la structure et de l'étendue du déséquilibre de liaison à différentes échelles et au niveau de différentes populations ou groupes de diversité à l'aide de 108 marqueurs répartis sur l'ensemble du génome nous a permis de proposer des populations utilisables pour les 2 types d'approches de génétique d'associations, scan génome entier ou région candidate. Un premier essai d'étude d'association a montré les potentialités importantes de ces approches pour notre espèce. Les implications de l'importance de la diversité génétique et de sa structure ainsi que de la structure du déséquilibre de liaison au sein de nos populations pour l'amélioration sont discutées.
- Published
- 2008
28. Déséquilibre de liaison et cartographie de QTL en population sélectionnée
- Author
-
Ytournel, Florence, ProdInra, Migration, Station de Génétique Quantitative et Appliquée (SGQA), Institut National de la Recherche Agronomique (INRA), AgroParisTech, Inconnu Inconnu, and AgroParisTech, Ecole
- Subjects
[SDV] Life Sciences [q-bio] ,Identity by descent ,LINKAGE DISEQUILIBRIUM ,Haplotypes ,[SDV]Life Sciences [q-bio] ,QTL FINE MAPPING ,Genetic markers ,Marqueurs génétiques ,these ,Selection ,Déséquilibre de liaison ,CARTOGRAPHIE FINE DE QTL ,Identité par descendance - Abstract
Linkage disequilibrium (LD) is due to non random associations between alleles at two loci. It has become a classical tool to fine map loci implied in quantitative trait (Quantitative Trait Loci, QTL) determinism, through identification of the maxima of LD between alleles of a marker locus (or a group of marker loci) and a locus involved in the variability of a quantitative trait. The creation and intensity of LD evolves according to the evolutionary forces affecting the population. Among these forces, random drift and selection are particularly present in livestock populations. This PhD thesis aimed to study the influence of selection on the structure of LD around a QTL, as well as its impact on the precision on the fine mapping of QTL. A software has been developed to simulate the evolution of populations. Starting from a population in linkage equilibrium, LD due to evolutionary forces is created over historical generations. QTL detection is applied to the next generations where the pedigree is known. The main experimental designs applied in livestock populations are implemented in the software. All data used for the further analysis of this work were obtained from this simulation program. We first analyzed LD in the neighbourhood of the QTL by recording the location of the marker in maximum LD with the QTL. LD was estimated with two classical measures: D' and, Par définition le déséquilibre de liaison (Linkage Disequilibrium, LD) décrit les associations préférentielles entre allèles de deux locus. Ce concept est devenu un outil indispensable pour la cartographie fine de locus quantitatifs (QTL), par l'identification de déséquilibres d'associations entre allèles à un locus marqueur (ou à un ensemble de locus marqueurs) et à un locus impliqué dans la variation d'un caractère quantitatif. La création et l'intensité du LD sont dépendantes des forces évolutives qui ont construit la population. Parmi ces forces, la dérive génétique et la sélection sont particulièrement actives dans les populations d'animaux de rente. Cette thèse a pour but d'étudier l'influence de la sélection sur la structure du déséquilibre de liaison autour d'un locus quantitatif, ainsi que son impact sur la précision de cartographie fine des QTL. Un logiciel de simulation de populations a été développé dans le cadre de la thèse. A partir d'une population en équilibre de liaison, il permet de générer du LD dans des générations dites historiques, grâce à différentes forces évolutives. La détection de QTL est appliquée aux générations suivantes, de généalogie connue. Pour ces dernières générations, les principaux dispositifs de détection de QTL de génétique animale sont décrits dans le simulateur. Les données exploitées dans cette thèse sont issues de ce logiciel. Le LD a été mesuré par le D' et le
- Published
- 2008
29. Extent of linkage disequilibrium in a large cattle population of Western Africa and consequences for association studies
- Author
-
Thevenon, S., Dayo, Guiguigbaza-Kossigan, Sylla, S., Sidibé, Issa, Berthier, Daphné, LEGROS, Hortense, Boichard, Didier, Eggen, Andre, Gautier, Mathieu, Station de Génétique Quantitative et Appliquée (SGQA), Institut National de la Recherche Agronomique (INRA), and Unité de recherche Génétique Biochimique et Cytogénétique (LGBC)
- Subjects
EFFECTIVE POPULATION SIZE ,microsatellite ,LINKAGE DISEQUILIBRIUM ,bovin ,effectif efficace ,[SDV]Life Sciences [q-bio] ,CATTLE ,MICROSATELLITE ,déséquilibre de liaison ,ComputingMilieux_MISCELLANEOUS - Abstract
International audience
- Published
- 2007
30. Single-nucleotide polymorphism frequency in a set of selected lines of bread wheat (Triticum aestivum L.)
- Author
-
Sébastien Praud, Gilles Charmet, Boulos Chalhoub, Delphine Samson, François Balfourier, Aurélie Canaguier, Philippe Dufour, Michel Beckert, Alain Murigneux, Frédéric SapetF. Sapet, Catherine Ravel, Dominique Brunel, Génétique Diversité et Ecophysiologie des Céréales (GDEC), Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Institut National de la Recherche Agronomique (INRA), BIOGEMMA, Etude du Polymorphisme des Génomes Végétaux (EPGV), Institut National de la Recherche Agronomique (INRA), Unité de Recherche Génomique Info (URGI), Ulice, Agriculture pour la Chimie et l'Energie (AGRICE), Unité de recherche en génomique végétale (URGV), Centre National de la Recherche Scientifique (CNRS)-Université d'Évry-Val-d'Essonne (UEVE)-Institut National de la Recherche Agronomique (INRA), Institut National de la Recherche Agronomique (INRA)-Université Blaise Pascal - Clermont-Ferrand 2 (UBP), and Institut National de la Recherche Agronomique (INRA)-Université d'Évry-Val-d'Essonne (UEVE)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
0106 biological sciences ,SINGLE NUCLEOTIDE POLYMORPHISM ,Linkage disequilibrium ,SNP ,Single-nucleotide polymorphism ,HAPLOTYPE ,DESEQUILIBRE DE LIAISON ,Biology ,01 natural sciences ,Polymorphism, Single Nucleotide ,Linkage Disequilibrium ,Polyploidy ,03 medical and health sciences ,Gene Frequency ,Polymorphism (computer science) ,Genetics ,Molecular Biology ,Allele frequency ,Triticum ,030304 developmental biology ,2. Zero hunger ,0303 health sciences ,[SDV.GEN]Life Sciences [q-bio]/Genetics ,Haplotype ,food and beverages ,General Medicine ,Bread ,Gene deletion ,Tag SNP ,BASE DE DONNEES ,LIGNEES ,Haplotypes ,POLYMORPHISME D'UNE PAIRE DE BASE ,Databases, Nucleic Acid ,Gene Deletion ,Genome, Plant ,010606 plant biology & botany ,Biotechnology - Abstract
Information on single-nucleotide polymorphisms (SNPs) in hexaploid bread wheat is still scarce. The goal of this study was to detect SNPs in wheat and examine their frequency. Twenty-six bread wheat lines from different origins worldwide were used. Specific PCR-products were obtained from 21 genes and directly sequenced. SNPs were discovered from the alignment of these sequences. The overall sequence polymorphism observed in this sample appears to be low; 64 single-base polymorphisms were detected in ~21.5 kb (i.e., 1 SNP every 335 bp). The level of polymorphism is highly variable among the different genes studied. Fifty percent of the genes studied contained no sequence polymorphism, whereas most SNPs detected were located in only 2 genes. As expected, taking into account a synthetic line created with a wild Triticum tauschii parent increases the level of polymorphism (101 SNPs; 1 SNP every 212 bp). The detected SNPs are available at http://urgi.versailles.inra.fr/GnpSNP. Data on linkage disequilibrium (LD) are still preliminary. They showed a significant level of LD in the 2 most polymorphic genes. To conclude, the genome size of hexaploid wheat and its low level of polymorphism complicate SNP discovery in this species.; La fréquence des marqueurs de type polymorphisme d'une paire de base (SNP) est encore mal connue chez le blé tendre hexaploïde. L'objectif du travail présenté est donc d'étudier l'abondance de ces marqueurs dans cette espèce. Pour cela 21 gènes (ou fragments) ont été amplifiés spécifiquement par PCR puis séquencés dans une collection de 26 lignées de blé tendre. Dans cet échantillon, nous avons détecté 64 évènements de polymorphisme d'une base pour environ 21,5 kb. Le niveau global de polymorphisme est relativement faible (1 SNP pour 334 pb) et très variable d'un gène à l'autre. La moitié des gènes étudiés est monomorphe alors que la plupart des SNPs proviennent de seulement 2 gènes. Le niveau de polymorphisme est augmenté par la prise en compte d'une lignée de blé synthétique (101 SNP; 1 SNP pour 212 pb). Tous les SNP détectés sont disponibles à http://urgi.versailles.inra.fr/GnpsSNP. Nous avons calculé le déséquilibre de liaison (DL) en utilisant les données des 2 gènes les plus polymorphes, situés sur le chromosome 1BL et distants de 1,3 cM. Le DL intragénique est significatif. Pour conclure, la taille et le faible niveau de polymorphisme du génome du blé hexaploïde compliquent la recherche de SNP dans cette espèce.
- Published
- 2006
- Full Text
- View/download PDF
31. Structure of linkage disequilibrium and length of IBD segments in simulated populations
- Author
-
Ytournel, Florence, Gilbert, Hélène, Druet, Tom, Boichard, Didier, Station de Génétique Quantitative et Appliquée (SGQA), and Institut National de la Recherche Agronomique (INRA)
- Subjects
LINKAGE DISEQUILIBRIUM ,[SDV]Life Sciences [q-bio] ,qtl ,QTL ,déséquilibre de liaison - Published
- 2006
32. Cartographie génétique fine par le graphe de recombinaison ancestral
- Author
-
Larribe, Fabrice, Lessard, Sabin, and Schork, Nicholas
- Subjects
Cartographie génétique fine ,Arbre de recombinaison ancestral (ARG) ,Processus de coalescence ,Taille de population variable ,Déséquilibre de liaison - Abstract
Thèse diffusée initialement dans le cadre d'un projet pilote des Presses de l'Université de Montréal/Centre d'édition numérique UdeM (1997-2008) avec l'autorisation de l'auteur.
- Published
- 2004
33. Linkage disequilibrium fine mapping of quantitative trait loci: a simulation study
- Author
-
Bruno Goffinet, Jihad Abdallah, Miguel Pérez-Enciso, Christine Cierco-Ayrolles, Station d'Amélioration Génétique des Animaux (SAGA), Institut National de la Recherche Agronomique (INRA), and Unité de Biométrie et Intelligence Artificielle (UBIA)
- Subjects
0106 biological sciences ,Linkage disequilibrium ,lcsh:QH426-470 ,[SDV]Life Sciences [q-bio] ,Population ,Quantitative Trait Loci ,caractère quantitatif ,Biology ,Quantitative trait locus ,01 natural sciences ,03 medical and health sciences ,quantitative trait locus ,Family-based QTL mapping ,Inclusive composite interval mapping ,Genetics ,Animals ,Humans ,Computer Simulation ,Genetics(clinical) ,Selection, Genetic ,déséquilibre de liaison ,Association mapping ,education ,Ecology, Evolution, Behavior and Systematics ,ComputingMilieux_MISCELLANEOUS ,030304 developmental biology ,Genetic association ,lcsh:SF1-1100 ,Linkage (software) ,0303 health sciences ,education.field_of_study ,cartographie fine ,Research ,Chromosome Mapping ,food and beverages ,General Medicine ,[SDV.GEN.GA]Life Sciences [q-bio]/Genetics/Animal genetics ,lcsh:Genetics ,Data Interpretation, Statistical ,fine mapping ,Animal Science and Zoology ,lcsh:Animal culture ,linkage disequilibrium ,010606 plant biology & botany - Abstract
International audience; Recently, the use of linkage disequilibrium (LD) to locate genes which affect quantitative traits (QTL) has received an increasing interest, but the plausibility of fine mapping using linkage disequilibrium techniques for QTL has not been well studied. The main objectives of this work were to (1) measure the extent and pattern of LD between a putative QTL and nearby markers in finite populations and (2) investigate the usefulness of LD in fine mapping QTL in simulated populations using a dense map of multiallelic or biallelic marker loci. The test of association between a marker and QTL and the power of the test were calculated based on single-marker regression analysis. The results show the presence of substantial linkage disequilibrium with closely linked marker loci after 100 to 200 generations of random mating. Although the power to test the association with a frequent QTL of large effect was satisfactory, the power was low for the QTL with a small effect and/or low frequency. More powerful, multi-locus methods may be required to map low frequent QTL with small genetic effects, as well as combining both linkage and linkage disequilibrium information. The results also showed that multiallelic markers are more useful than biallelic markers to detect linkage disequilibrium and association at an equal distance.
- Published
- 2003
- Full Text
- View/download PDF
34. Modèles alternatifs pour la détection de QTL dans les populations animales. III. Modèle hétéroscédastique et modèles correspondant à différentes distributions de l’effet du QTL
- Author
-
Pascale Le Roy, Jean-Michel Elsen, Brigitte Mangin, Bruno Goffinet, Didier Boichard, Unité de Biométrie et Intelligence Artificielle (UBIA), Institut National de la Recherche Agronomique (INRA), Station de Génétique Quantitative et Appliquée (SGQA), Station d'Amélioration Génétique des Animaux (SAGA), and INRA - Mathématiques et Informatique Appliquées (Unité MIAJ)
- Subjects
Heteroscedasticity ,Linkage disequilibrium ,HETEROSKEDASTIC MODEL ,LINKAGE DISEQUILIBRIUM ,lcsh:QH426-470 ,FAMILLE DE DEMI-FRERES ,HALF-SIB FAMILIES ,QTL DETECTION ,MODELE HETEROSCEDASTIQUE ,DESEQUILIBRE DE LIAISON ,Biology ,Quantitative trait locus ,03 medical and health sciences ,Statistics ,Genetic variation ,Genetics ,Genetics(clinical) ,déséquilibre de liaison ,Selection (genetic algorithm) ,Ecology, Evolution, Behavior and Systematics ,030304 developmental biology ,lcsh:SF1-1100 ,[SDV.GEN]Life Sciences [q-bio]/Genetics ,0303 health sciences ,Infinite number ,business.industry ,Research ,0402 animal and dairy science ,food and beverages ,04 agricultural and veterinary sciences ,General Medicine ,040201 dairy & animal science ,lcsh:Genetics ,[SDV.GEN.GA]Life Sciences [q-bio]/Genetics/Animal genetics ,détection de qtl ,Livestock ,Animal Science and Zoology ,lcsh:Animal culture ,business ,DETECTION DE QTL - Abstract
This paper describes two kinds of alternative models for QTL detection in livestock: an heteroskedastic model, and models corresponding to several hypotheses concerning the distribution of the QTL substitution effect among the sires: a fixed and limited number of alleles or an infinite number of alleles. The power of different tests built with these hypotheses were computed under different situations. The genetic variance associated with the QTL was shown in some situations. The results showed small power differences between the different models, but important differences in the quality of the estimations. In addition, a model was built in a simplified situation to investigate the gain in using possible linkage disequilibrium., Ce papier décrit deux types de modèles alternatifs pour la détection de QTL dans les populations animales : un modèle hétéroscédastique d’une part, et des modèles correspondants à différentes hypothèses sur la distribution de l’effet de substitution du QTL pour chaque mâle : un nombre fixe et limité d’allèles ou au contraire un nombre infini d’allèles. Les puissances des différents tests construits avec ces hypothèses sont calculées dans différentes situations. L’estimation de la variance génétique liée au QTL est donnée dans certaines situations. Les résultats montrent de faibles différences de puissance entre les différents modèles, mais des différences importantes dans la qualité des estimations. De plus, on construit un modèle dans une situation simplifiée pour étudier le gain que l’on peut obtenir en utilisant un éventuel déséquilibre de liaison.
- Published
- 1999
35. Genetic analysis of root traits in maize
- Author
-
Emmanuelle Guingo, Y. Hébert, Alain Charcosset, and Revues Inra, Import
- Subjects
[SDV.SA]Life Sciences [q-bio]/Agricultural sciences ,Population ,verse en végétation ,Locus (genetics) ,Root system ,Quantitative trait locus ,Biology ,Genetic analysis ,zea mays ,Inbred strain ,Botany ,Genetic variability ,déséquilibre de liaison ,education ,ComputingMilieux_MISCELLANEOUS ,[SDV.EE]Life Sciences [q-bio]/Ecology, environment ,education.field_of_study ,[SDV.SA] Life Sciences [q-bio]/Agricultural sciences ,qtl ,food and beverages ,Agricultural sciences ,[SDV.EE] Life Sciences [q-bio]/Ecology, environment ,PLEITROPIE ,Agronomy ,Genetic marker ,Agronomy and Crop Science ,Sciences agricoles - Abstract
In many areas around the world, maize (Zea Mays L.) crops are affected by root lodging. Several authors have previously shown that associations of root and shoot traits enabled the prediction of the resistance of genotypes to root lodging. In this preliminary attempt to understand the genetics of these traits, a set of 100 recombinant inbred lines from a cross between élite lines ’F2’ (early, susceptible to root lodging) and ’Io’ (late, lodging resistant) was considered. This population was characterised for 152 RFLP loci and root system traits in one location and for 2 years. QTLs were mapped using the average over years. Genetic and environmental correlations, together with co-localisation of QTLs for several traits, revealed genetic linkages, and some probable pleiotropic effects, which could be interpreted in terms of within-plant growth competition phenomena. The identification, on chromosome 5, of groups of loci involved in the control of the growth of the root system could help select against root lodging. (© Inra/Elsevier, Paris.), Dans de nombreuses régions du monde, la verse en végétation peut porter préjudice à la rentabilité de la culture de maïs. Plusieurs auteurs ont mis en évidence que des caractéristiques aériennes et racinaires, considérées ensemble, sont déterminantes dans la variation de la résistance. Dans une première approche, les caractères impliqués dans la résistance à la verse sont analysés génétiquement dans un lieu sur deux années, à partir de 100 lignées recombinantes issues du croisement de ’F2’ et ’Io’. À l’aide de 152 marqueurs RFLP, les QTL sont recherchés sur la moyenne des deux années. À partir des corrélations génétiques et environnementales ou à partir de la co-localisation des QTL, des linkages et des effets pléiotropiques entre les caractères sont révélés. La mise en évidence, sur le chromosome 5, de groupes de locus impliqués dans la croissance du système racinaire pourrait faciliter la sélection de génotypes résistants à la verse en végétation. (© Inra/Elsevier, Paris.)
- Published
- 1998
36. Valeur des marqueurs RAPD (Random Amplified Polymorphic DNA) dans l'étude de la microvariabilité d'un clonet majeur de Trypanosoma cruzi, agent de la maladie de Chagas
- Author
-
Tarrieu, Frédérique
- Subjects
GENETIQUE DE POPULATION ,RAPD.RANDOM AMPLIFIED POLYMORPHIC DNA ,CLONE NATUREL ,ISOENZYME ,MALADIE DE CHAGAS ,MICROEVOLUTION ,MARQUAGE GENETIQUE ,PHYLOGENIE ,DESEQUILIBRE DE LIAISON ,AGENT PATHOGENE - Abstract
L'analyse de 57 souches de #Trypanosoma cruzi$ par amplification de l'ADN par amorces aléatoires (Random Amplification of Polymorphic DNA=RAPD), et la comparaison des résultats avec des données isoenzymatiques obtenues indépendamment, ont permis de confirmer la valeur de cette nouvelle méthode comme outil épidémiologique et phylogénique. Cette étude, basée sur un marquage génétique très résolutif, a montré une variabilité génotypique non négligeable au sein des souches appartenant à un "clonet" (ensemble de génotypes clonaux apparaissant comme identiques pour une série de marqueurs donnée) antérieurement décrit. Dans le cadre d'un débat récemment ouvert, du fait d'un manque de puissance des tests statistiques dû à une variabilité génétique insuffisante, les présentes données ne permettent pas de dire si ce "clonet" est effectivement composé de génotypes clonaux, ou s'il correspond au contraire à une espèce cryptique sexuée. Cependant, la méthodologie nécessaire pour reprendre la question a été dégagée. (Résumé d'auteur)
- Published
- 1994
37. Microevolution of Trypanosoma cruzi natural clones
- Author
-
Neubauer, Katja
- Subjects
GENETIQUE DE POPULATION ,RAPD.RANDOM AMPLIFIED POLYMORPHIC DNA ,CLONE NATUREL ,ISOENZYME ,parasitic diseases ,MALADIE DE CHAGAS ,DESEQUILIBRE DE LIAISON ,BIOLOGIE MOLECULAIRE ,AGENT PATHOGENE ,PCR.REACTION DE POLYMERISATION EN CHAINE ,SONDE ,ADN KINETOPLASTIQUE - Abstract
Isoenzyme analysis of Chilean and Paraguayan stocks of #Trypanosoma cruzi$, the agent of Chagas' disease, was performed at 19 variable genetic loci. The results were interpreted in terms of evolutionary and population genetics. As previously shown for this parasite in other geographic areas, a basically clonal population structure was evidended, by both strong departures from Hardy-Weinberg expectations and high linkage disequilibrium. The isoenzyme variants of #Trypanosama cruzi$ (or zymodemes) behave as natural clones, stable in space and time, and should be considered as the relevant taxonomic unit for medical studies. Two main clusters of clones were evidenced, separated by high genetic distances. Comparison between clonal populations in sylvatic and domestic transmission cycles of the disease in Chile strongly suggested that these two cycles are at least partly separated from one another. For comparison purposes with the isoenzyme results, two molecular techniques were performed, namely DNA-probe analysis of the kinetoplast DNA (an extranuclear genome) and Arbitrarily Primed Polymerase Chain Reaction (AP-PCR). The results of these two methods corroborated the isoenzyme data, and AP-PCR appeared as a new and promising tool for #Trypanosoma cruzi$ strain identification. (Résumé d'auteur)
- Published
- 1991
38. Imputation-Based Analysis of Association Studies: Candidate Regions and Quantitative Traits
- Author
-
Matthew Stephens, Bertrand Servin, Laboratoire de Génétique Cellulaire (LGC), Institut National de la Recherche Agronomique (INRA)-Ecole Nationale Vétérinaire de Toulouse (ENVT), Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées, Department of Statistics, University of Washington [Seattle], and Servin, Bertrand
- Subjects
haplotype ,Cancer Research ,Candidate gene ,Genotype ,lcsh:QH426-470 ,[SDV]Life Sciences [q-bio] ,polymorphisme snp ,Single-nucleotide polymorphism ,Genome-wide association study ,Computational biology ,Quantitative trait locus ,Biology ,Models, Biological ,Polymorphism, Single Nucleotide ,03 medical and health sciences ,0302 clinical medicine ,génétique d'association ,Homo (Human) ,Odds Ratio ,Genetics ,Humans ,déséquilibre de liaison ,International HapMap Project ,Molecular Biology ,Genetics (clinical) ,Ecology, Evolution, Behavior and Systematics ,030304 developmental biology ,Genetic association ,0303 health sciences ,Models, Statistical ,Polymorphism, Genetic ,Chromosome Mapping ,Computational Biology ,Genetics and Genomics ,Bayes Theorem ,Genomics ,Tag SNP ,lcsh:Genetics ,Phenotype ,Data Interpretation, Statistical ,Mathematics ,Software ,030217 neurology & neurosurgery ,Imputation (genetics) ,Research Article - Abstract
We introduce a new framework for the analysis of association studies, designed to allow untyped variants to be more effectively and directly tested for association with a phenotype. The idea is to combine knowledge on patterns of correlation among SNPs (e.g., from the International HapMap project or resequencing data in a candidate region of interest) with genotype data at tag SNPs collected on a phenotyped study sample, to estimate (“impute”) unmeasured genotypes, and then assess association between the phenotype and these estimated genotypes. Compared with standard single-SNP tests, this approach results in increased power to detect association, even in cases in which the causal variant is typed, with the greatest gain occurring when multiple causal variants are present. It also provides more interpretable explanations for observed associations, including assessing, for each SNP, the strength of the evidence that it (rather than another correlated SNP) is causal. Although we focus on association studies with quantitative phenotype and a relatively restricted region (e.g., a candidate gene), the framework is applicable and computationally practical for whole genome association studies. Methods described here are implemented in a software package, Bim-Bam, available from the Stephens Lab website http://stephenslab.uchicago.edu/software.html., Author Summary Ongoing association studies are evaluating the influence of genetic variation on phenotypes of interest (hereditary traits and susceptibility to disease) in large patient samples. However, although genotyping is relatively cheap, most association studies genotype only a small proportion of SNPs in the region of study, with many SNPs remaining untyped. Here, we present methods for assessing whether these untyped SNPs are associated with the phenotype of interest. The methods exploit information on patterns of multi-marker correlation (“linkage disequilibrium”) from publically available databases, such as the International HapMap project or the SeattleSNPs resequencing studies, to estimate (“impute”) patient genotypes at untyped SNPs, and assess the estimated genotypes for association with phenotype. We show that, particularly for common causal variants, these methods are highly effective. Compared with standard methods, they provide both greater power to detect associations between genetic variation and phenotypes, and also better explanations of detected associations, in many cases closely approximating results that would have been obtained by genotyping all SNPs.
- Published
- 2007
- Full Text
- View/download PDF
39. Natural populations of Trypanosoma cruzi, the agent of Chagas disease, have a complex multiclonal structure
- Author
-
Philip J. Ward, Michel Tibayrenc, Francisco J. Ayala, and Andrés Moya
- Subjects
Most recent common ancestor ,Trypanosoma cruzi ,Population genetics ,DESEQUILIBRE DE LIAISON ,RESEAU DE WAGNER ,VARIATION ENZYMATIQUE ,CLONE ,parasitic diseases ,TRYPANOSOMIASE HUMAINE ,Animals ,Genetic variability ,Allele ,SPECIATION ,LIAISON GENETIQUE ,Mexico ,Alleles ,Genetics ,Multidisciplinary ,Polymorphism, Genetic ,biology ,Genetic heterogeneity ,South America ,biology.organism_classification ,Biological Evolution ,Diploidy ,EVOLUTION ,United States ,Isoenzymes ,MALADIE DE CHAGAS ,Trypanosoma ,Adaptation ,AGENT PATHOGENE ,Research Article - Abstract
We have studied 15 gene loci coding for enzymes in 121 Trypanosoma cruzi stocks from a wide geographic range--from the United States and Mexico to Chile and southern Brazil. T. cruzi is diploid but reproduction is basically clonal, with very little if any sexuality remaining at present. We have identified 43 different clones by their genetic composition; the same genetic clone is often found in very distant places and in diverse hosts. There is much genetic heterogeneity among the different clones, and they cannot be readily classified into a few discrete groups that might represent natural taxa. These findings imply that the biological and medical characteristics need to be ascertained separately for each natural clone. The evidence indicates that clonal evolution is very ancient in T. cruzi. We propose two alternative hypotheses concerning the relationship between the biochemical diversity and the heterogeneity in other biological and medical characteristics of T. cruzi. One hypothesis is that the degree of diversity between strains simply reflects the time elapsed since their last common ancestor. The second hypothesis is that biological and medical heterogeneity is recent and reflects adaptation to different transmission cycles. A decision between the two hypotheses can be reached with appropriate studies, with important medical consequences.
- Published
- 1986
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.