Back to Search Start Over

MinYS: mine your symbiont by targeted genome assembly in symbiotic communities

Authors :
Christophe Mougel
Wesley Delage
Fabrice Legeai
Claire Lemaitre
Jean-Christophe Simon
Cervin Guyomar
German Centre for Integrative Biodiversity Research (iDiv)
Institut de Génétique, Environnement et Protection des Plantes (IGEPP)
Université de Rennes 1 (UR1)
Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-AGROCAMPUS OUEST
Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)
Scalable, Optimized and Parallel Algorithms for Genomics (GenScale)
Inria Rennes – Bretagne Atlantique
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-GESTION DES DONNÉES ET DE LA CONNAISSANCE (IRISA-D7)
Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA)
Université de Bretagne Sud (UBS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National de Recherche en Informatique et en Automatique (Inria)-École normale supérieure - Rennes (ENS Rennes)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1)
Université de Rennes (UNIV-RENNES)-CentraleSupélec-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Bretagne Sud (UBS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA)
Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-École normale supérieure - Rennes (ENS Rennes)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)
Institut national de recherche en informatique et en automatique (INRIA)
Université de Rennes (UR)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-INSTITUT AGRO Agrocampus Ouest
Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)
Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique)
Source :
NAR Genomics and Bioinformatics, NAR Genomics and Bioinformatics, Oxford University Press, 2020, 2 (3), pp.1-11. ⟨10.1093/nargab/lqaa047⟩, NAR Genomics and Bioinformatics, 2020, 2 (3), pp.1-11. ⟨10.1093/nargab/lqaa047⟩
Publication Year :
2020
Publisher :
HAL CCSD, 2020.

Abstract

Most metazoans are associated with symbionts. Characterizing the effect of a particular symbiont often requires to get access to its genome, which is usually done by sequencing the whole community. We present MinYS, a targeted assembly approach to assemble one particular genome of interest from such metagenomic data. First, taking advantage of a reference genome, a subset of the reads is assembled into a set of backbone contigs. Then, this draft assembly is completed using the whole metagenomic readset in a de novo manner. The resulting assembly is output as a genome graph, allowing to distinguish different strains with potential structural variants coexisting in the sample. MinYS was applied to 50 pea aphid re-sequencing samples, with low and high diversity, in order to recover the genome sequence of its obligatory bacterial symbiont, Buchnera aphidicola. It was able to return high quality assemblies (one contig assembly in 90% of the samples), even when using increasingly distant reference genomes, and to retrieve large structural variations in the samples. Due to its targeted essence, it outperformed standard metagenomic assemblers in terms of both time and assembly quality.

Details

Language :
English
ISSN :
26319268
Database :
OpenAIRE
Journal :
NAR Genomics and Bioinformatics, NAR Genomics and Bioinformatics, Oxford University Press, 2020, 2 (3), pp.1-11. ⟨10.1093/nargab/lqaa047⟩, NAR Genomics and Bioinformatics, 2020, 2 (3), pp.1-11. ⟨10.1093/nargab/lqaa047⟩
Accession number :
edsair.doi.dedup.....09565bb040feb40528fb6304aba72c6f
Full Text :
https://doi.org/10.1093/nargab/lqaa047⟩