Guillaume Evanno, Marie Massot, Erwan Guichoux, Marie-Agnès Coutellec, Raphaelle Rinaldo, Guillaume Longin, Elodie Réveillac, Dominique Barloy, Adrien Oger, Adline Delcamp, Jean-Marc Roussel, Patricia Le Quilliec, Clémence Genthon, Eric J. Petit, Sophie Launey, Olivier Lorvelec, Regis Vigouroux, Gilles Lassalle, Pierre-Yves Le Bail, Chrystelle Delord, Écologie et santé des écosystèmes (ESE), Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Laboratoire-Environnement de Petit Saut, Hydreco, Biodiversité, Gènes et Communautés, Institut National de la Recherche Agronomique (INRA), GeT PlaGe, Genotoul, Laboratoire de Physiologie et Génomique des Poissons (LPGP), Structure Fédérative de Recherche en Biologie et Santé de Rennes ( Biosit : Biologie - Santé - Innovation Technologique )-Institut National de la Recherche Agronomique (INRA), Parc Amazonien de Guyane, Association Nationale de la Recherche et de la Technologie, Agence de l’Eau Seine Normandie, DREAL, Office de l’Eau de Guyane, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), Biodiversité, Gènes & Communautés (BioGeCo), Institut National de la Recherche Agronomique (INRA)-Université de Bordeaux (UB), Génome et Transcriptome - Plateforme Génomique (GeT-PlaGe), Institut National de la Recherche Agronomique (INRA)-Plateforme Génome & Transcriptome (GET), Génopole Toulouse Midi-Pyrénées [Auzeville] (GENOTOUL), Institut National des Sciences Appliquées - Toulouse (INSA Toulouse), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Ecole Nationale Vétérinaire de Toulouse (ENVT), Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut National des Sciences Appliquées - Toulouse (INSA Toulouse), Université Fédérale Toulouse Midi-Pyrénées-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Génopole Toulouse Midi-Pyrénées [Auzeville] (GENOTOUL), Université Fédérale Toulouse Midi-Pyrénées-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Institut National de la Recherche Agronomique (INRA)-Structure Fédérative de Recherche en Biologie et Santé de Rennes ( Biosit : Biologie - Santé - Innovation Technologique ), Université Toulouse III - Paul Sabatier (UT3), and Université Fédérale Toulouse Midi-Pyrénées-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Université Toulouse III - Paul Sabatier (UT3)
Multispecies population genetics is an emerging field that provides insight relevant to conservation biology and community ecology. However, to date, this approach is limited to species with available genetic resources. The use of thousands of single-nucleotide polymorphism (SNP) markers developed from recent genotyping-by-sequencing (GBS) technologies is a roadmap for the study of nonmodel species, but remains cost prohibitive when several, distantly related species are involved. We aimed to overcome this issue using a single HiSeq3000 run of restriction-site associated DNA sequencing (RAD-Seq) to retrieve SNP markers for 40 diverse species including plants, invertebrates, fish, and mammals. We developed a Python-based pipeline to isolate c. 100–500 high-quality SNP markers for each species that could be genotyped through classical PCR amplification methods. To assess the quality of these markers, we validated our approach on c. 160 of the characterized SNPs for each of 18 Neotropical fish species from the river Maroni (French Guiana, South America), using the MassARRAY iPLEX platform from Agena Bioscience (San Diego, CA, USA). A run of the pipeline applying stringent filtering parameters enabled the successful design of between 130 and 3,492 SNP markers for 30 of the 40 study species. Relaxing pipeline parameters allows for an increase in the number of detected SNPs. Across the 18 species from French Guiana, an average of 85% of markers were successfully amplified, polymorphic, and scored in ≥90% of individuals (c. 200 individuals per species). The great majority (>98%) of these markers were at Hardy–Weinberg equilibrium in each sampling site from the river Maroni. This SNP discovery was performed at the cost of c. $US110 for each of the 40 species. Genotyping was performed at the cost of c. $US6000 for each of the 18 fish species with an average of 200 individuals per species. This strategy was found cost-and-time efficient to develop hundreds of SNP markers for a large range of nonmodel species, which can be used to investigate ecological and evolutionary questions that do not require whole-genome coverage.