1. Annotation of microsporidian genomes using transcriptional signals
- Author
-
Ivan Wawrzyniak, Sébastien Terrat, Olivier Gonçalves, Nicolas Parisot, Pierre Peyret, Patrick Wincker, Corinne Biderre-Petit, Simone Duprat, Frédéric Delbac, Jean Weissenbach, Sébastien Rimour, Eric Dugat-Bony, Antoine Mahul, Gaelle Samson, Brigitte Chebance, Stéphanie Bornes, Jérémie Denonfoux, Eric Peyretaillade, Michael Katinka, Valérie Polonais, Conception, Ingénierie et Développement de l'Aliment et du Médicament ( CIDAM ), Université d'Auvergne - Clermont-Ferrand I ( UdA ), Laboratoire Microorganismes : Génome et Environnement ( LMGE ), Université Blaise Pascal - Clermont-Ferrand 2 ( UBP ) -Université d'Auvergne - Clermont-Ferrand I ( UdA ) -Centre National de la Recherche Scientifique ( CNRS ), Agroécologie [Dijon], Institut National de la Recherche Agronomique ( INRA ) -Université de Bourgogne ( UB ) -AgroSup Dijon - Institut National Supérieur des Sciences Agronomiques, de l'Alimentation et de l'Environnement, Laboratoire d'Informatique, de Modélisation et d'optimisation des Systèmes ( LIMOS ), Université Blaise Pascal - Clermont-Ferrand 2 ( UBP ) -Université d'Auvergne - Clermont-Ferrand I ( UdA ) -Sigma CLERMONT ( Sigma CLERMONT ) -Centre National de la Recherche Scientifique ( CNRS ), Génie Biologie, Genoscope - Centre national de séquençage [Evry] ( GENOSCOPE ), Commissariat à l'énergie atomique et aux énergies alternatives ( CEA ), Génomique métabolique ( UMR 8030 ), Commissariat à l'énergie atomique et aux énergies alternatives ( CEA ) -Université d'Évry-Val-d'Essonne ( UEVE ) -Université Paris-Saclay-Centre National de la Recherche Scientifique ( CNRS ), Institut de Génomique d'Evry ( IG ), Commissariat à l'énergie atomique et aux énergies alternatives ( CEA ) -Université Paris-Saclay, Conception, Ingénierie et Développement de l'Aliment et du Médicament (CIDAM), Université d'Auvergne - Clermont-Ferrand I (UdA), Laboratoire Microorganismes : Génome et Environnement (LMGE), Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Centre National de la Recherche Scientifique (CNRS)-Université d'Auvergne - Clermont-Ferrand I (UdA), Institut National de la Recherche Agronomique (INRA)-Université de Bourgogne (UB)-AgroSup Dijon - Institut National Supérieur des Sciences Agronomiques, de l'Alimentation et de l'Environnement-Université Bourgogne Franche-Comté [COMUE] (UBFC), Genomic platform and R&D, GenoScreen, Centre de Recherche en Nutrition Humaine d'Auvergne (CRNH d'Auvergne), Laboratoire Microorganismes : Génome et Environnement - Clermont Auvergne (LMGE), Université Clermont Auvergne (UCA)-Centre National de la Recherche Scientifique (CNRS), Centre Régional de Ressources Informatiques (CRRI), Clermont Université, Bioprocédés Appliqués aux Microalgues (GEPEA-BAM), Laboratoire de génie des procédés - environnement - agroalimentaire (GEPEA), Ecole Nationale Vétérinaire, Agroalimentaire et de l'alimentation Nantes-Atlantique (ONIRIS)-Université Bretagne Loire (UBL)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Nantes (UN)-Centre National de la Recherche Scientifique (CNRS)-Ecole Nationale Vétérinaire, Agroalimentaire et de l'alimentation Nantes-Atlantique (ONIRIS)-Université Bretagne Loire (UBL)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Nantes (UN)-Centre National de la Recherche Scientifique (CNRS), IUT Génie Biologique, Laboratoire de Biologie, Université d'Auvergne (Clermont Ferrand 1) (UdA), Genoscope - Centre national de séquençage [Evry] (GENOSCOPE), Université Paris-Saclay-Direction de Recherche Fondamentale (CEA) (DRF (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Génomique métabolique (UMR 8030), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Direction de Recherche Fondamentale (CEA) (DRF (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université d'Évry-Val-d'Essonne (UEVE)-Centre National de la Recherche Scientifique (CNRS), Structure et évolution des génomes (SEG), CNS-Université d'Évry-Val-d'Essonne (UEVE)-Centre National de la Recherche Scientifique (CNRS), Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université d'Auvergne - Clermont-Ferrand I (UdA)-Centre National de la Recherche Scientifique (CNRS), Institut National de la Recherche Agronomique (INRA)-Université de Bourgogne (UB)-AgroSup Dijon - Institut National Supérieur des Sciences Agronomiques, de l'Alimentation et de l'Environnement, Laboratoire d'Informatique, de Modélisation et d'optimisation des Systèmes (LIMOS), Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université d'Auvergne - Clermont-Ferrand I (UdA)-SIGMA Clermont (SIGMA Clermont)-Ecole Nationale Supérieure des Mines de St Etienne (ENSM ST-ETIENNE)-Centre National de la Recherche Scientifique (CNRS), Institut Universitaire de Technologie - Nantes (IUT Nantes), Université de Nantes (UN)-Université de Nantes (UN)-Université de Nantes - UFR des Sciences et des Techniques (UN UFR ST), Université de Nantes (UN)-Université de Nantes (UN)-Institut Universitaire de Technologie Saint-Nazaire (IUT Saint-Nazaire), Université de Nantes (UN)-Ecole Polytechnique de l'Université de Nantes (EPUN), Université de Nantes (UN)-École nationale vétérinaire, agroalimentaire et de l'alimentation Nantes-Atlantique (ONIRIS)-Centre National de la Recherche Scientifique (CNRS)-Université Bretagne Loire (UBL)-IMT Atlantique (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Institut Universitaire de Technologie - La Roche-sur-Yon (IUT La Roche-sur-Yon), Université de Nantes (UN)-Institut Universitaire de Technologie - Nantes (IUT Nantes), Université de Nantes (UN), Institut de Génomique d'Evry (IG), Université Paris-Saclay-Institut de Biologie François JACOB (JACOB), Direction de Recherche Fondamentale (CEA) (DRF (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Direction de Recherche Fondamentale (CEA) (DRF (CEA)), Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020]), Université de Nantes - UFR des Sciences et des Techniques (UN UFR ST), Université de Nantes (UN)-Université de Nantes (UN)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Centre National de la Recherche Scientifique (CNRS)-Ecole Polytechnique de l'Université de Nantes (EPUN), Université de Nantes (UN)-Université de Nantes (UN)-Institut Universitaire de Technologie - Nantes (IUT Nantes), Université de Nantes (UN)-Institut Universitaire de Technologie Saint-Nazaire (IUT Saint-Nazaire), Université de Nantes (UN)-Institut Universitaire de Technologie - La Roche-sur-Yon (IUT La Roche-sur-Yon), Université de Nantes (UN)-Ecole Nationale Vétérinaire, Agroalimentaire et de l'alimentation Nantes-Atlantique (ONIRIS)-Université Bretagne Loire (UBL)-Université de Nantes - UFR des Sciences et des Techniques (UN UFR ST), Université de Nantes (UN)-Ecole Nationale Vétérinaire, Agroalimentaire et de l'alimentation Nantes-Atlantique (ONIRIS)-Université Bretagne Loire (UBL), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Centre National de la Recherche Scientifique (CNRS)-Université d'Évry-Val-d'Essonne (UEVE), Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université d'Auvergne - Clermont-Ferrand I (UdA)-Sigma CLERMONT (Sigma CLERMONT)-Centre National de la Recherche Scientifique (CNRS)-Ecole Nationale Supérieure des Mines de St Etienne, Institut de Biologie François JACOB (JACOB), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay, SIGMA Clermont (SIGMA Clermont)-Université d'Auvergne - Clermont-Ferrand I (UdA)-Ecole Nationale Supérieure des Mines de St Etienne-Centre National de la Recherche Scientifique (CNRS)-Université Blaise Pascal - Clermont-Ferrand 2 (UBP), and Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université d'Évry-Val-d'Essonne (UEVE)
- Subjects
Transcription, Genetic ,genome annotation ,MESH : Molecular Sequence Annotation ,General Physics and Astronomy ,MESH: Phosphotransferases ,Genome ,transcriptional signal ,MESH : Protein Transport ,MESH : Fungal Proteins ,DNA, Fungal ,Conserved Sequence ,ComputingMilieux_MISCELLANEOUS ,Genetics ,0303 health sciences ,Fungal protein ,MESH: Conserved Sequence ,Multidisciplinary ,MESH: Genomics ,030302 biochemistry & molecular biology ,Genomics ,Genome project ,Protein Transport ,Molecular Sequence Annotation ,[ SDV.BBM.GTP ] Life Sciences [q-bio]/Biochemistry, Molecular Biology/Genomics [q-bio.GN] ,MESH: Genome, Fungal ,MESH: Fungal Proteins ,MESH : Phosphotransferases ,Genome, Fungal ,Transposable element ,MESH: Protein Transport ,Genes, Fungal ,MESH: Molecular Sequence Annotation ,MESH : Microsporidia ,MESH : Open Reading Frames ,Computational biology ,Biology ,General Biochemistry, Genetics and Molecular Biology ,Fungal Proteins ,Open Reading Frames ,03 medical and health sciences ,MESH : Conserved Sequence ,[SDV.BBM.GTP]Life Sciences [q-bio]/Biochemistry, Molecular Biology/Genomics [q-bio.GN] ,Anncaliia algerae ,parasitic diseases ,Gene ,030304 developmental biology ,bioinformatic ,MESH: Transcription, Genetic ,MESH : Genome, Fungal ,Phosphotransferases ,structural annotation ,MESH : Genomics ,fungi ,MESH : Transcription, Genetic ,General Chemistry ,MESH: Open Reading Frames ,MESH: Microsporidia ,MESH: DNA, Fungal ,microsporidia ,MESH : Genes, Fungal ,[INFO.INFO-BI]Computer Science [cs]/Bioinformatics [q-bio.QM] ,MESH : DNA, Fungal ,MESH: Genes, Fungal - Abstract
EA GenoSol CT3; International audience; High-quality annotation of microsporidian genomes is essential for understanding the biological processes that govern the development of these parasites. Here we present an improved structural annotation method using transcriptional DNA signals. We apply this method to re-annotate four previously annotated genomes, which allow us to detect annotation errors and identify a significant number of unpredicted genes. We then annotate the newly sequenced genome of Anncaliia algerae. A comparative genomic analysis of A. algerae permits the identification of not only microsporidian core genes, but also potentially highly expressed genes encoding membrane-associated proteins, which represent good candidates involved in the spore architecture, the invasion process and the microsporidian-host relationships. Furthermore, we find that the ten-fold variation in microsporidian genome sizes is not due to gene number, size or complexity, but instead stems from the presence of transposable elements. Such elements, along with kinase regulatory pathways and specific transporters, appear to be key factors in microsporidian adaptive processes.
- Published
- 2012