Back to Search Start Over

Measuring Genetic Differentiation from Pool-seq Data

Authors :
Raphaël Leblois
Mathieu Gautier
Valentin Hivert
Eric J. Petit
Renaud Vitalis
Centre de Biologie pour la Gestion des Populations (UMR CBGP)
Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Institut National de la Recherche Agronomique (INRA)-Centre international d'études supérieures en sciences agronomiques (Montpellier SupAgro)-Université de Montpellier (UM)-Institut de Recherche pour le Développement (IRD [France-Sud])-Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro)
Institut de Biologie Computationnelle (IBC)
Université de Montpellier (UM)-Institut National de la Recherche Agronomique (INRA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)
Écologie et santé des écosystèmes (ESE)
Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST
Institut National de la Recherche Agronomique (INRA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)
Institut National de la Recherche Agronomique's Plant Health and Environment (SPE) Division
Biodi-vERsA project EXOTIC : ANR-13-EBID-0001
project SWING of the French National Research Agency : ANR-16-CE02-0015
CORBAM project of the French region Hauts-de-France
ANR-16-CE02-0015,SWING,Invasion mondiale de la drosophile à aile tachetée: Génétique, plasticité et potentiel évolutif(2016)
Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)
Source :
Genetics, Genetics, Genetics Society of America, 2018, 210 (1), pp.315-330. ⟨10.1534/genetics.118.300900⟩, Genetics, 2018, 210 (1), pp.315-330. ⟨10.1534/genetics.118.300900⟩, Genetics 1 (210), 315-330. (2018)
Publication Year :
2018

Abstract

The recent advent of high throughput sequencing and genotyping technologies enables the comparison of patterns of polymorphisms at a very large number of markers. While the characterization of genetic structure from individual sequencing data remains expensive for many non-model species, it has been shown that sequencing pools of individual DNAs (Pool-seq) represents an attractive and cost-effective alternative. However, analyzing sequence read counts from a DNA pool instead of individual genotypes raises statistical challenges in deriving correct estimates of genetic differentiation. In this article, we provide a method-of-moments estimator ofFSTfor Pool-seq data, based on an analysis-of-variance framework. We show, by means of simulations, that this new estimator is unbiased, and outperforms previously proposed estimators. We evaluate the robustness of our estimator to model misspecification, such as sequencing errors and uneven contributions of individual DNAs to the pools. Last, by reanalyzing published Pool-seq data of different ecotypes of the prickly sculpinCottus asper, we show how the use of an unbiasedFSTestimator may question the interpretation of population structure inferred from previous analyses.

Details

ISSN :
19432631 and 00166731
Volume :
210
Issue :
1
Database :
OpenAIRE
Journal :
Genetics
Accession number :
edsair.doi.dedup.....db306bfd1891445b1fd61824b710a4ed