Back to Search Start Over

ƒ‐statistics estimation and admixture graph construction with Pool‐Seq or allele count data using the R package poolfstat

Authors :
Laurence Flori
Arnaud Estoup
Renaud Vitalis
Mathieu Gautier
Centre de Biologie pour la Gestion des Populations (UMR CBGP)
Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Université de Montpellier (UM)-Institut de Recherche pour le Développement (IRD [France-Sud])-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut Agro - Montpellier SupAgro
Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)
Systèmes d'élevage méditerranéens et tropicaux (UMR SELMET)
Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut Agro - Montpellier SupAgro
This work was supported by the French National Research Agency (ANR) for the projects SWING (ANR-16-CE02-0015) and GANDHI (ANR-20-CE02-0018).
ANR-16-CE02-0015,SWING,Invasion mondiale de la drosophile à aile tachetée: Génétique, plasticité et potentiel évolutif(2016)
ANR-20-CE02-0018,GANDHI,Génomique de l'invasion de la coccinelle Harmonia axyridis(2020)
Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Centre international d'études supérieures en sciences agronomiques (Montpellier SupAgro)-Université de Montpellier (UM)-Institut de Recherche pour le Développement (IRD [France-Sud])-Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro)
Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)
Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Centre international d'études supérieures en sciences agronomiques (Montpellier SupAgro)-Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro)
Source :
Molecular Ecology Resources, Molecular Ecology Resources, 2022, 22 (4), pp.1394-1416. ⟨10.1111/1755-0998.13557⟩, Molecular Ecology Resources, Wiley/Blackwell, 2021, ⟨10.1111/1755-0998.13557⟩
Publication Year :
2022
Publisher :
HAL CCSD, 2022.

Abstract

By capturing various patterns of the structuring of genetic variation across populations, f -statistics have proved highly effective for the inference of demographic history. Such statistics are defined as covariance of SNP allele frequency differences among sets of populations without requiring haplotype information and are hence particularly relevant for the analysis of pooled sequencing (Pool-Seq) data. We here propose a reinterpretation of the F (and D) parameters in terms of probability of gene identity and derive from this unified definition unbiased estimators for both Pool-Seq and standard allele count data obtained from individual genotypes. We implemented these estimators in a new version of the R package poolfstat, which now includes a wide range of inference methods: (i) three-population test of admixture; (ii) four-population test of treeness; (iii) F4-ratio estimation of admixture rates; and (iv) fitting, visualization and (semi-automatic) construction of admixture graphs. A comprehensive evaluation of the methods implemented in poolfstat on both simulated Pool-Seq (with various sequencing coverages and error rates) and allele count data confirmed the accuracy of these approaches, even for the most cost-effective Pool-Seq design involving low sequencing coverages. We further analyzed a real Pool-Seq data made of 14 populations of the invasive species Drosophila suzukii which allowed refining both the demographic history of native populations and the invasion routes followed by this emblematic pest. Our new package poolfstat provides the community with a user-friendly and efficient all-in-one tool to unravel complex population genetic histories from large-size Pool-Seq or allele count SNP data.

Details

Language :
English
ISSN :
1755098X and 17550998
Database :
OpenAIRE
Journal :
Molecular Ecology Resources, Molecular Ecology Resources, 2022, 22 (4), pp.1394-1416. ⟨10.1111/1755-0998.13557⟩, Molecular Ecology Resources, Wiley/Blackwell, 2021, ⟨10.1111/1755-0998.13557⟩
Accession number :
edsair.doi.dedup.....5c09af98efb615dffaf166cfe3ac7b24