Descriptor: "Génomique" / Language: french - Searchworks@Jio Institute Digital Library Search Results

Your search keyword '"Génomique"' showing total 538 results

Start Over Descriptor "Génomique" Language french

538 results on '"Génomique"'

1. Les marqueurs génétiques pour les aptitudes.

Author: Ricard, Anne
Abstract: Copyright of Nouveau Praticien Vétérinaire - Équine is the property of EDP Sciences and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
Published: 2023
Full Text: View/download PDF

2. À propos du document de l’Agence nationale de la recherche Les apports de la génomique à l’agroécologie

Author: Hainzelin Étienne
Subjects: génomique, agroécologie, intégration des données, diversité fonctionnelle, Science, Social Sciences
Abstract: Comment les outils de la génomique peuvent-ils concrètement contribuer à la transition agroécologique de la production agricole ? Cette question est traitée au travers de l’analyse d’un corpus des 1 200 projets de recherche dans les différents domaines de la génomique, financés par l’Agence nationale de la recherche (ANR) entre 2005 et 2019. L’analyse débouche sur une proposition de quatre pistes prioritaires pour les recherches futures en génomique pour l’agroécologie.
Published: 2022
Full Text: View/download PDF

3. La domestication des champignons Penicillium du fromage

Author: Ropars, Jeanne, Caron, Thibault, Lo, Ying-Chu, Bennetot, Bastien, and Giraud, Tatiana
Subjects: Domestication, Fromage, Champignon, Penicillium, Adaptation, Génomique, Biology (General), QH301-705.5
Abstract: Domestication is the process of organism evolution under selection by humans, and as such has been a model for studying adaptation since Charles Darwin. Here we review recent studies on the genomics of adaptation and domestication syndrome in two cheese-making fungal lineages, Penicillium roqueforti used for maturing blue cheeses, and the Penicillium camemberti species complex used for making soft cheeses such as Camembert and Brie. Comparative genomics have revealed horizontal gene transfers involved in convergent adaptation to cheese. Population genomics have identified differentiated populations with contrasted traits, several populations having independently been domesticated for cheese making in both P. roqueforti and the Penicillium camemberti species complex, and having undergone bottlenecks. The different cheese populations have acquired traits beneficial for cheese making in comparison to non-cheese populations, regarding color, spore production, growth rates on cheese, salt tolerance, lipolysis, proteolysis, volatile compound or toxin production and/or competitive ability. The cheese populations also show degeneration for some unused functions such as decreased ability of sexual reproduction or of growth under harsh conditions. These recent findings have fundamental importance for our understanding of adaptation and have applied interest for strain improvement.
Published: 2020
Full Text: View/download PDF

4. Polyarthrite et maladie de Huntington.

Author: Massy, Emmanuel, Roudier, Jean, and Balandraud, Nathalie
Published: 2023
Full Text: View/download PDF

5. Les études moléculaires sur le palmier dattier (Phoenix dactylifera L.) : Article de synthèse.

Author: Hammadi Hamza and Ali Ferchichi
Subjects: Palmier dattier, Moléculaire, Génomique, Post-génomique, Agriculture
Abstract: Le palmier dattier possède certaines caractéristiques qui en font des organismes difficiles à étudier pour la localisation et l’identification des gènes. L’amélioration de la productivité, la qualité du fruit et la résistance aux stress biotiques et abiotiques est le principal objectif des analyses moléculaires chez le palmier dattier. Dans ce papier, nous examinons les progrès considérables dans ce domaine et leur état. On a passé en revue les progrès des études de la génomique chez le palmier dattier afin de fournir une référence utile aux chercheurs travaillant dans ce domaine. Le progrès des techniques moléculaires facilitera les programmes d'amélioration au moyen de la sélection moléculaire
Published: 2020

6. Evolutions et perspectives des formations pour la génétique et la sélection animale.

Author: ROGNON, Xavier, HEAMS, Thomas, Ducos, Alain, Charpentier, Régis, MAGNOL, Laetitia, RESTOUX, Gwendal, RIGAL, Joël, and VERRIER, Étienne
Abstract: Copyright of Ethnozootechnie is the property of Societe d Ethnozootechnie and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
Published: 2021

7. Comment faire entrer la médecine de précision dans la décision thérapeutique de routine au lit du malade ?

Author: Lemaitre F, Florentin V, Blin O, Bayle A, Benito S, Chauny JV, Galaup A, Korchagina D, Lang M, Le Tourneau C, Pelloux H, Picard N, and Guilhaumou R
Subjects: Humans, Precision Medicine, Artificial Intelligence
Published: 2024
Full Text: View/download PDF

8. Nouvelles techniques génétiques de dépistage et diagnostic anténatals : quels enjeux ?

Author: Désir, J., Meunier, C., Billard, J.-M., Marichal, A., Rombout, S., and Grisart, B.
Abstract: New genomic techniques are revolutionizing the prenatal screening and diagnosis, by allowing access to diagnoses of fetal and/or parental conditions whose penetrance is not always complete. These techniques raise many questions, in a sensitive context, ethically different from postnatal follow-up. The creation of multidisciplinary national and international think tanks is fundamental to consider about the important diagnoses or susceptibility factors to relate to the couple during pregnancy. [ABSTRACT FROM AUTHOR]
Published: 2020
Full Text: View/download PDF

9. Dynamique des génomes et évolution moléculaire des récepteurs chimiosensoriels des vecteurs de la maladie de Chagas du genre Rhodnius

Author: Merle, Marie, Evolution, génomes, comportement et écologie (EGCE), Institut de Recherche pour le Développement (IRD)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Université Paris-Saclay, Myriam Harry, and Florence Mougel
Subjects: Hemiptera, Génomique, Vecteurs de la maladie de Chagas, [SDV.BID.EVO]Life Sciences [q-bio]/Biodiversity/Populations and Evolution [q-bio.PE], Vectors of Chagas disease, Phylogenomics, Chemosensory genes, Gènes chimiosensoriels, Genomics, Adaptation, [SDV.BID.SPT]Life Sciences [q-bio]/Biodiversity/Systematics, Phylogenetics and taxonomy, [SDV.BIBS]Life Sciences [q-bio]/Quantitative Methods [q-bio.QM], Phylogénomique
Abstract: Triatominae are haematophagous bugs that can transmit Trypanosoma cruzi, the causative agent of Chagas disease, endemic to Latin America. In the wild, species belonging to the genus Rhodnius mainly infest palm trees, feeding on a wide range of vertebrate hosts that find refuge in this habitat. However, some Rhodnius species are domiciliary, i.e. they have left their natural habitat (sylvatic environment) and have come into close contact with human populations by colonising their dwellings, and can then transmit T. cruzi to humans. The evolutionary history of species belonging to Rhodnius genus was assessed using a phylogenomic strategy based on whole mitogenome sequences and a set of 51 nuclear genes, characterized for 36 samples representing 16 species out of the 24 described in the genus. This approach allowed us to determine the evolutionary relationship between the 3 major groups of species (pallescens, pictipes and prolixus), to integrate species from Psammolestes genus inside the genus one, and to describe multiple introgression events between species. A comparative genomic approach was conducted between species living in different habitats. The genome size was estimated using flow cytometry and analysis of high throughput sequencing data. Genomes from 11 Rhodnius species (including 4 domiciliary species) were assembled and used to build a calibrated phylogeny including sequences from published genomes and fossil records. The divergence times inferred from this phylogeny allowed us to study genome dynamics. It revealed that the rate of gains and losses per gene per million years is 7.5 times faster in domiciliary species compared to sylvatic ones. This study has made it possible to propose candidate genes including chemosensory receptors involved in the domiciliation of species of the genus Rhodnius. Chemosensory genes belong to multigene families with rapid evolutionary dynamics that cause changes in sensory sensitivity. Their study is especially relevant when searching for genes involved in the recognition of a new environment. The chemosensory receptors were annotated (from 49 to 135 ORs and from 21 to 32 GRs depending on the species studied) and analyzed to detect evidence of selection pressure: 4 candidate genes (OR1, OR38, OR102 and ORco) were identified that could be involved in the domiciliation process. A better understanding of the mechanisms of adaptation of these bugs to their environment could be a key factor in vector control efforts.; Les Triatominae sont des punaises hématophages vectrices de Trypanosoma cruzi, agent responsable de la maladie de Chagas, endémique en Amérique Latine. En milieu naturel, les punaises hématophages du genre Rhodnius infestent principalement les palmiers et se nourrissent sur une large gamme d'hôtes vertébrés qui trouvent refuge dans cet habitat. Cependant, certaines espèces de Rhodnius sont domiciliaires, c'est-à-dire qu'elles ont quitté leur habitat naturel (milieu sylvatique) et sont venues en contact étroit avec les populations humaines en colonisant leurs habitations. Les liens de parenté entre les différentes espèces du genre Rhodnius ont été retracés par une approche phylogénomique reposant sur l'étude des mitogénomes et d'un set de 51 gènes nucléaires et incluant 16 espèces sur les 24 espèces décrites via l'étude de 36 échantillons. Cette approche phylogénomique a permis de statuer sur les affinités évolutives des 3 groupes d'espèces décrits (pallescens, pictipes et prolixus), de classer les espèces du genre Psammolestes au sein du genre Rhodnius et de montrer des événements d'introgression multiples entre espèces. Cette étude phylogénétique a été complétée par une approche de génomique comparative entre espèces adaptées à différents habitats. La taille des génomes a été estimée par deux méthodes, la cytométrie de flux et l'analyse des données moléculaires à haut débit. Pour étudier la dynamique des génomes une phylogénie calibrée à l'aide de données fossiles a été réalisée. Onze génomes de Rhodnius (dont 4 domiciliaires) ont été assemblés puis annotés. L'estimation de la vitesse de gains et pertes de gènes par million d'années montre que ces événements se produisent 7.5 fois plus rapidement chez les espèces domiciliaires en comparaison des espèces sylvatiques. Cette étude a permis de proposer des gènes candidats dont des récepteurs chimiosensoriels impliqués dans la domiciliation des espèces du genre Rhodnius. Les gènes chimiosensoriels appartiennent à des familles multigéniques dont la dynamique évolutive est rapide et à l'origine de changements dans la sensibilité sensorielle. Ils sont donc des objets d'étude de choix dans la recherche de gènes impliqués dans la reconnaissance d'un nouvel environnement. L'annotation spécifique de ces récepteurs chimiosensoriels (de 49 à 135 ORs, de 21 à 32 GRs, selon les espèces) suivie de la recherche de gènes sous sélection a permis de mettre en évidence 4 gènes candidats en lien avec la domiciliation (OR1, OR38, OR102 et ORco). Une meilleure compréhension des mécanismes d'adaptation des punaises hématophages à leur environnement pourrait être un facteur clé dans l'effort de lutte antivectorielle.
Published: 2023

10. Intérêt et contribution de l’ADN tumoral circulant : une révolution dans la prise en charge du cancer du pancréas ou un outil supplémentaire dansl’arsenal actuel ?

Author: Rougerie, Tristan, Aix-Marseille Université - Faculté de pharmacie (AMU PHARM), Aix Marseille Université (AMU), and Romaric Lacroix
Subjects: Génomique, ADN tumoral circulant, Biomarqueur, Cancer du pancréas, [SDV]Life Sciences [q-bio], Séquençage, Dépistage, Diagnostic, [SDV.SP]Life Sciences [q-bio]/Pharmaceutical sciences, Profilage moléculaire
Abstract: Le cancer du pancréas est une maladie agressive associée à un mauvais pronostic clinique, à des options thérapeutiques peu efficaces et à un manque de méthodes de détection précoce. Les raisons de son mauvais pronostic sont principalement liées au diagnostic tardif de ce cancer. Les patients ne présentent généralement pas de symptôme spécifique et il n’y a pas d’outils ou de biomarqueurs précoces permettant un dépistage de la population générale. D’autre part, le profilage moléculaire du cancer du pancréas est insuffisant pour développer des thérapies ciblées et personnalisées efficaces. Aujourd'hui, pour essayer de faire face à ces défis, la recherche se tourne vers les biopsies liquides qui sont peu invasives et permettent de suivre en temps réel l’évolution et l'hétérogénéité des tumeurs. Grâce au progrès de la recherche génomique et au développement de nouvelles technologies de séquençage (dPCR et le NGS) plus sensibles et plus spécifiques, les biopsies liquides offrent de nombreuses applications cliniques potentielles. L’analyse de l’ADNtc dans le sang semble être une méthode très prometteuse pour améliorer la prise en charge de ce cancer. L’ADNtc muté KRAS seul ou associé avec d’autres biomarqueurs, la quantité d’ADNlc ou encore les variations de la méthylation de l’ADNlc sont des biomarqueurs présentant une valeur pronostique et prédictive intéressante mais encore insuffisante pour le dépistage. Les résultats des études sur l’application clinique de l'ADNtc pour le dépistage, le diagnostic, le profilage moléculaire, le pronostic et la surveillance de la réponse thérapeutique doit être évaluée par de nouvelles études prospectives sur un plus grand nombre de patients afin de confirmer que les informations fournies contribuent de manière significative à l'amélioration de la prise en charge des patients. D’autre part, pour une application clinique de routine, il est nécessaire de réduire les coûts et de standardiser les protocoles.
Published: 2023

11. Caractérisation moléculaire des micro-organismes endophytes de la canneberge (Vaccinium macrocarpon Ait.)

Author: Salhi, Lila Naouelle and Lang, Franz Bernd
Subjects: Transcriptomique, Stimulation of plant growth, Ericoid mycorrhizal fungi (ErMF), Champignons mycorhiziens éricoïdes (ErMF), Protéines effectrices, Biocontrol, Effector proteins, Bacteria-fungi interactions, Cranberry (Vaccinium macrocarpon Aiton), Génomique, Transcriptomic, Canneberge (Vaccinium macrocarpon Aiton), Stimulation de la croissance des plantes, Bacillus velezensis EB37, Endophytes, Genomic, Bio-contrôle, Interactions bactéries-champignons, CAZymes, Lachnum sp. EC5
Abstract: Il a été établi que la majorité des plantes vasculaires abritent des micro-organismes endophytes bactériens et fongiques, qui peuvent coloniser les tissus végétaux et former des associations allant du mutualisme à la pathogénèse. Les symbioses végétales mutualistes les plus communes impliquent les champignons endo-mycorhiziens arbusculaires (AMF). Ces champignons s’associent aux racines des plantes et leur permettent d’améliorer leur nutrition minérale, tandis qu’ils bénéficient des composés produits par l'hôte. Toutefois, les plantes de la famille Ericaceae s’engagent plutôt dans des associations mutualistes avec les champignons mycorhiziens éricoïdes (ErMF). Ces derniers sont morphologiquement et taxonomiquement mal définis, en apparence distribués aléatoirement parmi les espèces issues des grandes divisions taxonomiques des Ascomycota et Basidiomycota. En raison de cette incohérence taxonomique et de l'absence d'une histoire évolutive explicative, la diversité réelle de ces champignons est mal caractérisée. De ce fait, ce projet vise à étudier le microbiote associé à la plante Ericaceae Vaccinium macrocarpon Aït (canneberge), axant la recherche sur les angles morphologiques, génomiques et transcriptomiques des champignons de type ErMF et autres endophytes capables de contrôler la croissance des agents phytopathogènes et de stimuler la croissance des plantes. Notre première démarche présentée dans le chapitre 2 s’est focalisée sur la caractérisation du microbiote endophyte bactérien et fongique de la canneberge, une plante vivace principalement produite en Amérique du Nord, notamment au Québec. Nous avons isolé et identifié 180 micro-organismes à partir de plantes de cultivars variés, collectées de champs différents, et avons démontré l'existence d'une variabilité dans le microbiote selon les tissus, les cultivars, et même entre les champs d'une même ferme. Parmi les endophytes d’intérêt identifiés, l’isolat fongique Lachnum sp. EC5 a stimulé la croissance des cultivars de canneberge Stevens et Mullica Queen et a formé des structures intracellulaires similaires à celles des ErMF à l’intérieur des cellules racinaires de la canneberge. De plus, l’isolat EB37 identifié Bacillus velezensis s’est révélé être un puissant agent antifongique, montrant cependant une tolérance particulière au champignon Lachnum sp. EC5, lors des tests de confrontation. Ce volet sera détaillé avec plus de précision dans le chapitre 4. Le chapitre 3 a porté sur l’analyse génomique comparative de l’isolat fongique Lachnum sp. EC5 avec plusieurs espèces de champignons Leotiomycetes ErMF, saprophytes et pathogènes. Nous avons analysé le sécrétome protéique prédit de ces champignons et mis en évidence que les gènes codant pour les enzymes de dégradation des parois végétales ne sont pas corrélés au mode de vie fongique (mycorhizien, pathogène ou saprophyte). A l’inverse, 10 protéines effectrices de Lachnum sp. EC5 prédites pour cibler spécifiquement un compartiment intracellulaire chez les cellules végétales ont des similarités avec celles d’espèces mutualistes comme Meliniomyces variabilis et Oidiodendron maius. Aussi, la protéine effectrice putative Zn-MP, prédite pour cibler, potentiellement, les chloroplastes végétaux nous permet de proposer un rôle dans le renforcement de l’immunité végétale. Le chapitre 4 s’est intéressé aux mécanismes de régulation d'expression de gènes induits lors de l’interaction entre le champignon Lachnum sp. EC5 et la bactérie B. velezensis EB37. Ces mécanismes ont été comparés à ceux activés chez la bactérie en présence de champignons pathogènes. Nous avons démontré une physiologique cellulaire bactérienne distincte en présence de Lachnum sp. EC5, dénotée par une faible expression des gènes induits lors du stress nutritif associé aux processus de sporulation, de formation du biofilm, de secretion de CAZymes et de lipopeptides. Nous avons suggéré que la sous-régulation de ces mécanismes serait essentiellement explicable par une disponibilité plus importante en glucose ou en d’autres sources de carbone préférentielles pour la bactérie. En réponse, le champignon Lachnum sp. EC5 a vécu différents changements morphologiques. Il aurait détoxifié ses environnements intra et extra-cellulaires et surexprimé sa voie de production de carbone dépendante du cycle du glyoxylate, générant ainsi des conditions favorisant un contact physique entre les deux micro-organismes. En conclusion, nous avons argumenté et documenté que la définition des ErMF basée uniquement sur des critères morphologiques est mal adaptée à catégoriser ces champignons. Notre approche multidisciplinaire a mis en évidence la diversité du microbiote de la canneberge, a étendu la notion d’ErMF à d'autres champignons jusqu'ici exclus de ce groupe, et a souligné l'importance des associations interspécifiques sur l’interaction ErMF-plantes. Ces avancées permettront d’améliorer nos connaissances sur le microbiote des plantes éricacées contribuant, au développement de solutions environnementales éco-responsables pour l’industrie de la canneberge., It has been established that the majority of vascular plants harbour bacterial and fungal endophytes that colonize plant tissues, and thus form associations that range from mutualism to pathogenesis. Mycorrhizal fungi are a particular class of endophytes that associate with plant roots and enhance plant mineral uptake. The most common type of mutualistic plant symbiosis involves arbuscular mycorrhizal fungi (AMF), whereas plants of the Ericaceae family instead engage in mutualistic associations with ericoid mycorrhizal fungi (ErMF). The ErMF group, in its current definition, includes both ascomycete and basidiomycete species, yet is morphologically, taxonomically and evolutionarily poorly defined, which implies that the group’s true diversity is not well understood. The objective of this project is to complement morphological information with genomic and transcriptomic data to better understand the role of ErMF in 1) controlling the negative effects of pathogenic infections, and 2) the potential plant growth stimulation for the Ericaceous plant Vaccinium macrocarpon Ait. Our first approach presented in Chapter 2 focused on the characterization of the bacterial and fungal endo-symbiotic microbiota of the Ericaceous plant, Vaccinium macrocarpon Ait (cranberry), a perennial plant mainly in North America, particularly in Quebec. We isolated ~180 distinct bacterial and fungal endophytes collected from roots, stems, and leaves of cranberry plants cultivated in Quebec, Canada. We show that the cranberry microbiome varies substantially between tissues, cultivars, and across fields of the same farm. Among the isolated endophytes, the fungus Lachnum sp. EC5 was found to promote the growth of cranberry cultivars Stevens and Mullica Queen, and to form intracellular structures resembling those other ErMF inside the cortical root cells. In addition, the bacterium Bacillus velezensis (EB37) has been found to be a potent antifungal agent. Interestingly, a confrontation test between EB37 and the fungus Lachnum sp. EC5 revealed a mutual tolerance, which we will describe later in chapter 4. In chapter 3, our project focused on the comparative genomic analysis of the fungus Lachnum sp. EC5 with several Leotiomycete ErMF, saprophytes and pathogens. We analyzed fungal secretomes and demonstrated that genes encoding plant cell wall degradation enzymes are conserved between the tested fungi which suggests that such proteins are not indicative of a particular fungal lifestyle. On the other hand, 10 effector proteins identified in Lachnum sp. EC5 were also only found in mutualistic fungi, such as Meliniomyces variabilis, Oidiodendron maius and have been reported to target the plant intracellular compartments. Also, the identification of the putative effector protein Zn-MP, specific to Lachnum sp. EC5 and predicted to target plant chloroplasts, suggest a role in the reinforcement of plant immunity. Chapter 4 focuses on the patterns of gene expression regulation induced in the biocontrol bacterium B. velezensis EB37 in interaction with the potentially mutualistic fungus Lachnum sp. EC5. These mechanisms were then compared to those activated when the bacterium is in the presence of pathogenic/saprophytic fungi. We demonstrated that in co-culture with Lachnum sp. EC5, EB37expresses fewer genes related to stress, and fewer related to the stationary phase which often involves production of bacterial biofilms and lipopeptides, such as mycosubtilin. We suggest that the lessened response to stress is related to an increased availability of glucose or other preferential sources of carbons for the bacterium. Conversely, Lachnum sp. EC5 in the presence of EB37 underwent morphological changes by a higher lateral branching., detoxified its external and internal environment by expressing both a catalase activity and efflux pumps, and overexpressed its glyoxylate cycle-dependent carbon production pathway, and thus promoting favourable conditions for close physical contact with the bacterium. In conclusion, we demonstrated that the morphological-based definitions are poorly adapted to the categorization of ErMF fungi. Our multidisciplinary approach highlighted the diversity of the cranberry microbiota, extended the notion of ErMF to other fungi hitherto excluded from this fungal group and underlined the importance of interspecific associations on the ErMF-plant interaction. These advances enhance our understanding of the Ericaceous plant microbiota and contributes to the development of sustainable solutions for the cranberry industry.
Published: 2023

12. Séquençage du génome entier des entérobactéries productrices de bêtalactamases à spectre élargi au sein d’un établissement de santé : mise en place en routine et rôle dans le contrôle des transmissions croisées

Author: Fevre, Margo, Jeanne-Leroyer, Camille, Déquiré, Paul, Gravey, François, and Hello, Simon Le
Subjects: Génomique, Hygiène hospitalière, Typage, Épidémie, Investigations, Transmission croisée
Abstract: Introduction et objectif. Depuis 2019, le séquençage du génome entier est réalisé en routine pour toutes les entérobactéries productrices de bêtalactamases à spectre élargi (EBLSE) isolées chez les patients hospitalisés en réanimation au centre hospitalier universitaire de Caen. Cette étude évalue un algorithme d’alerte simple afin de détecter les transmissions croisées et les épidémies. Matériel et méthodes. L’alerte de transmission croisée est basée sur l’identification de deux EBLSE de même espèce en réanimation adulte sur une période d’un mois glissant. Les performances de ces alertes étaient calculées pour trois espèces d’EBLSE (Klebsiella pneumoniae, Escherichia coli et Enterobacter cloacae complexe) en les comparant aux données issues du séquençage des souches isolées en 2019 et 2020 puis en prospectif en 2021. Résultats. L’algorithme a été créé à partir des 320 souches d’EBLSE identifiées et séquencées : 138 E. coli, 91 K. pneumoniae et 91 E. cloacae. Le taux global de transmission croisée était de 22% en 2019-2020 (respectivement 1,5%, 42% et 33% pour chaque espèce) et de 21,2% en 2021 (0%, 16,7% et 54,0%). La valeur prédictive positive de notre algorithme est de 14,3% pour E. coli, 92,7% pour K. pneumoniae et 51,8% pour E. cloacae. Conclusion. Par une approche génomique, nous pouvons détecter et alerter toute transmission croisée afin d’adapter les mesures de prévention ainsi que les enquêtes environnementales en cas d’épidémie. L’algorithme donne une orientation précoce des alertes mais peut et doit s’adapter selon les dynamiques de diffusion, qui semblent être différentes entre espèces.
Published: 2023
Full Text: View/download PDF

13. Évaluation de l’imputation des données génétiques Canadiennes-Françaises

Author: Pelletier, Justin and Hussin, Julie
Subjects: Genotyping, French-Canadian, Bioinformatics, Founder population, Génotypage, Panels de référence, Canadien français, Québec, Génomique, Génétique des populations, Population fondatrice, Genomic, Bio-informatique, Population genetic, Reference panels, Imputation
Abstract: L'imputation est désormais un outil essentiel dans l'analyse des études d'association à l'échelle du génome, permettant l'estimation de génotypes à des positions variables du génome non génotypées, via des inférences statistiques à partir d'haplotypes contenus dans un panel de référence utilisé pour l'imputation, soit une bibliothèque d’haplotype séquencés phasés en haplotypes. Les données génétiques imputés servent aux études d’associations sur les traits et maladies complexes. La population fondatrice canadienne-française est une population très utile dans les études d'association génétique en raison de sa diversité unique d'haplotypes et de l'excès de variantes rares. Ici, nous décrivons les défis qui accompagnent l'imputation de cette population fondatrice, qui n'est pas représentée dans les panels de référence disponibles, ainsi que la stratégie optimale pour imputer des ensembles de données génotypés hétérogènes, provenant de plusieurs plateformes de génotypage. Nous avons caractérisé l'imputation de 29,356 individus génotypés sur plusieurs puces de génotypage de la province du Québec constituant la cohorte CARTaGENE (CaG). Nous avons établi que le panel de référence le plus récent et le plus diversifié Trans-Omics for Precision Medecine (TOPMed) a surpassé le panel de référence Haplotype Reference Consortium (HRC) dans l'ensemble de données canadienne-française de CaG. Nous avons évalué la précision de l'imputation avec le un score de qualité (R2) fréquemment utilisé, ainsi que l’exactitude calculée en fonction des génotypes aux variants observés par séquençage, disponibles dans CARTaGENE pour un sous-groupe d’individus. Nous avons déterminé que la stratégie optimale pour augmenter la qualité d'imputation sur des ensembles de données hétérogènes a été atteinte en fusionnant chaque sous-ensemble de données après les avoir imputés individuellement. Ce résultat ouvre la voie à l’intégration de cohortes génotypées hétérogènes dans les études d’associations. Nos résultats soulignent également les défis que représente une population fondatrice pour l'imputation, en comparant la qualité de l'imputation de CaG avec d'autres sous-cohortes canadiennes du projet CanPath, soit l’Ontario, l’Alberta, la Colombie-Britannique et les provinces atlantiques. Ces résultats mettent en évidence l'impact de l’absence de diversité haplotypique spécifique dans les panels de référence sur l'imputation d'une population européenne fondatrice récente, démontrant l'importance de la représentativité de la population étudiée dans ces panels., Imputation is now an essential tool in the analysis of genome-wide association studies, allowing the estimation of genotypes at variable positions of the ungenotyped genome, via statistical inferences from haplotypes contained in a reference panel used for imputation, (a library of sequenced genotypes phased into haplotype). Imputed genetic data is used for association studies of complex traits and diseases. The French-Canadian founder population is a very useful population in genetic association studies due to its unique haplotype’s diversity and excess of rare variants. Here, we describe the challenges that come with imputing this founder population, which is not represented in available reference panels, as well as the optimal strategy for imputing heterogeneous genotyped datasets, from multiple genotyping platforms. We characterized the imputation of 29,356 individuals genotyped on multiple genotyping arrays from the province of Quebec constituting the CARTaGENE (CaG) cohort. We established that the newer and more diverse Trans-Omics for Precision Medicine (TOPMed) reference panel outperformed the Haplotype Reference Consortium (HRC) reference panel in the CaG French-Canadian dataset. We evaluated the precision of the imputation with the frequently used quality score (R2), as well as the accuracy calculated according to the genotypes observed by sequencing, available in CARTaGENE for a subgroup of individuals. We determined that the optimal strategy for increasing imputation quality on heterogeneous datasets was achieved by merging each subset of data after imputing them individually. This result opens the way to the integration of heterogeneous genotyped cohorts in association studies. Our results also highlight the challenges of a founder population for imputation, comparing the quality of CaG imputation with other Canadian sub-cohorts of the CanPath project, namely Ontario, Alberta, British-Columbia, and the Atlantic provinces. These results highlight the impact of the absence of specific haplotypic diversity in the reference panels on the imputation of a recent European founder population, demonstrating the importance of the representativeness of the population studied in these panels.
Published: 2022

14. Méthode d'apprentissage profond pour l'analyse génomique des cancers canins comme modèle des cancers humains

Author: Kergal, Camille, Institut de Génétique et Développement de Rennes (IGDR), Université de Rennes (UR)-Centre National de la Recherche Scientifique (CNRS)-Structure Fédérative de Recherche en Biologie et Santé de Rennes ( Biosit : Biologie - Santé - Innovation Technologique ), Université de Rennes, Christophe Hitte, and Thomas Derrien
Subjects: Apprentissage profond, Génomique, Modèle animal, Deep learning, Genomics, Species model, Cancers, [SDV.MHEP]Life Sciences [q-bio]/Human health and pathology
Abstract: Deep learning (DL) methods have recently been shown to be powerful strategies for predicting the regulatory activity of a genomic sequence and thus for ultimately assessing the impact of regulatory mutations on gene expression. The Basenji tool proposes a DL approach using convolutional neural networks to predict the expression level of human genes. We adapted this program to train a dog-specific gene expression model and showed that this model achieved similar performance to that observed in humans, with high correlations between real and predicted expression levels (r=0.66). To predict the ex- pression level of canine genes, we show that the canine prediction model (within-species approach) leads to better performances than the human model (cross-species approach), particularly due to some specific features of canine sequences (GC content, transposable elements and evolutionary conservation). As the dog is a spontaneous model for human cancers, we used these models to predict the impact of non-coding mutations on the expression of genes involved in cancers. We identified 1301 common mutations to both humans and dogs, suggesting a functional role in the regulation of the expression of genes involved in cancer. Finally, models and tools to exploit them are available on GitHub: https://github.com/ckergal/BLIMP.; Les méthodes d’apprentissage profond (DL) se sont récemment révélées être de puissantes stratégies pour prédire l’activité régulatrice d’une séquence génomique et donc pour, in fine, évaluer l’impact des mutations régulatrices sur l’expression des gènes. L’outil Basenji propose une approche DL utilisant des réseaux de neurones convolutifs pour prédire le niveau d’expression de gènes humains. Nous avons adapté ce programme pour entraîner un modèle d’expression génique spécifique au chien et montré que ce modèle de prédiction atteignait des performances similaires à celles observées chez l’homme, avec des corrélations élevées entre les niveaux d’expression réels et ceux pré- dits (r=0,66). Pour prédire le niveau d’expression de gènes canins, nous démontrons également que l’utilisation du modèle de prédiction canin (approche intra-espèce) aboutit à de meilleures performances que le modèle humain (approche inter-espèce), notamment en lien avec certaines caractéristiques spécifiques aux séquences canines (niveau de GC, d’éléments transposable et conservation évolutive). Le chien étant un modèle naturel pour l’étude des cancers humains, nous avons également exploité ces modèles pour prédire l’impact de mutations non-codantes sur l’expression de gènes impliqués dans les cancers. Nous avons ainsi localisé 1301 mutations communes entre l’homme et le chien, suggérant un rôle fonctionnel dans la régulation de l’expression de gènes impliqués dans les cancers. Finalement, nos modèles et les outils pour les exploiter sont disponibles sur GitHub : https://github.com/ckergal/BLIMP.
Published: 2022

15. Genomics applied to the study of campylobacter and helicobacter infections

Author: Jehanne, Quentin, BoRdeaux Institute in onCology (Inserm U1312 - BRIC), Université de Bordeaux (UB)-Institut National de la Santé et de la Recherche Médicale (INSERM), Université de Bordeaux, Philippe Lehours, and STAR, ABES
Subjects: Genomique, Ngs, Helicobacter, Linux, Campylobacter, Genomics, [INFO.INFO-BI]Computer Science [cs]/Bioinformatics [q-bio.QM], Python, [INFO.INFO-BI] Computer Science [cs]/Bioinformatics [q-bio.QM]
Abstract: Intestinal and gastric bacterial infections caused by Campylobacter and Helicobacter bacteria are frequent: Campylobacter species can lead to severe gastroenteritis cases through the consumption of contaminated products such as meat and Helicobacter bacteria may be responsible of ulcers or gastric cancers. More than 200,000 campylobacteriosis cases are reported in the European Union each year. It has also been shown that about 50% of the world population is infected with Helicobacter pylori. A large number of Campylobacter strains and gastric biopsies from clinical cases are received daily at the French National Reference Center for Campylobacters and Helicobacter (NRCCH) where analyses such as species identification and antimicrobial resistance determination are performed. Several methods are used to study these pathogens: bacterial cultures, antibiograms, MALDI-TOF mass spectrometry and DNA extraction for real-time PCR. Despite the fact these analyses are cheap and quick, it may also introduce some disadvantages: for example species identification using MALDI-TOF is sometimes non-significant and the determination of molecular resistance mecanisms among resistant isolates can also be challenging. Today, next-gen sequencing is a crucial tool to generate a large amount of data and, combined with bioinformatics, can solve numerous clinical problems encountered in the laboratory. In order to modernize the analysis of French clinical cases performed at the NRCCH, various bioinformatic tools and scripts were set up and developped during this PhD. The main objective was to enrich our knowledge on these bacterial infections by highlighting DNA and protein sequences variations involved in various problematics. Over these three years, we have then identify: SNPs (Single Nucleotide Polymorphisms) within the genome of Campylobacter coli that are able to discriminate three different sources of contamination (chickens, cattle and pigs), new antimicrobial resistance genes that have emerged in France in the past few years but also new Campylobacter and Helicobacter species. These differents data and tools are now routinely used in the NRCCH laboratory. All these analyses were made possible by the use of Linux environment and Bash or Python programming languages allowing the study of thousands of DNA sequences from a variety of clinical isolates that have been sequenced throughout many projects. This «genomic exploration» was here the key to answer the different clinical issues., Les infections bactériennes intestinales et gastriques par les bactéries du genre Campylobacter et Helicobacter sont très fréquentes: l’une pouvant provoquer des gastro-entérites sévères des suites d’une contamination alimentaire (principalement la viande) et l’autre étant liée au développement d’ulcères ou bien de cancers gastriques. Plus de 200 000 cas de campylobacterioses sont recensés dans l’Union Européenne chaque année, avec comme principale espèce Campylobacter jejuni. De plus, environ 50% de la population mondiale est infectée par Helicobacter pylori. De très nombreuses souches de Campylobacter et de biopsies gastriques sont reçues quotidiennement au CNR des Campylobacters et des Hélicobacters (CNRCH) où y sont menées des analyses telles l’identification de l’espèce et de la résistance aux antibiotiques. Plusieurs méthodes sont mises en place pour étudier ces pathogènes : cultures bactériennes, antibiogrammes, spectromètre de masse MALDI-TOF et extraction d’ADN pour des PCR en temps réel. Malgré la rapidité et le moindre coût de ces méthodes, les utiliser en routine présente des désavantages notamment des identifications d’espèces parfois non concluantes avec le MALDI-TOF ou la difficulté de déterminer les mécanismes moléculaires de résistance. Aujourd’hui, le séquençage haut débit couplé à la bio-informatique permet de générer des données cruciales pour résoudre ces nombreuses problématiques rencontrées en laboratoire. C’est en vue de moderniser les analyses de cas cliniques français effectuées au CNRCH que différents outils et scripts bio-informatiques ont été mis en place mais aussi développés durant ce doctorat. Le principal objectif étant d’enrichir nos connaissances sur ces infections bactériennes : de mettre en évidence des variations dans les séquences d’ADN (gène et mutations) mais aussi protéiques impliquées dans diverses problématiques. Ainsi, il a pu être identifié durant ces trois années : des SNPs (Single Nucleotide Polymorphisms) dans le génome de Campylobacter coli spécifiques à trois différentes sources de contamination (la volaille, les bovins et les porcs), des nouveaux gènes de résistance aux antibiotiques qui émergent sur le territoire métropolitain mais aussi des nouvelles espèces du genre Helicobacter ou Campylobacter. Ces outils et données sont d’ores et déjà utilisés en routine au sein du CNRCH. Toutes ces analyses ont pu être possibles via l’utilisation de l’environnement Linux (progammation Bash et Python) permettant d’étudier des milliers de séquences d’ADN provenant d’une variété de souches séquencées au cours des différents projets. Cette «exploration génomique» fût ici la clé pour répondre aux différentes problématiques cliniques.
Published: 2022

16. Les big data, généralités et intégration en radiothérapie.

Author: Le Fèvre, C., Poty, L., and Noël, G.
Abstract: Résumé Les nombreuses avancées dans les systèmes informatiques (collection de données, bases de données, stockage), les possibilités diagnostiques et thérapeutiques sont responsables d’une augmentation et d’une diversification des données disponibles. Les big data offrent les capacités, dans le domaine de la santé, d’accélérer les découvertes et d’optimiser la prise en charge des patients en combinant un nombre de données presque infini par la création de modèles thérapeutiques. En radiothérapie, le développement des big data est attrayant car les données à traiter sont très nombreuses et hétérogènes (démographiques, radiomiques, génomiques, radiogénomiques, etc.). La prédiction de l’efficacité et de la tolérance du traitement par irradiation serait alors optimisée. Avec ces nouveaux concepts, encore au stade préliminaire, il apparaît possible de développer une médecine de haute précision et personnalisée, toujours plus sécurisée et fiable. The many advances in data collection computing systems (data collection, database, storage), diagnostic and therapeutic possibilities are responsible for an increase and a diversification of available data. Big data offers the capacities, in the field of health, to accelerate the discoveries and to optimize the management of patients by combining a large volume of data and the creation of therapeutic models. In radiotherapy, the development of big data is attractive because data are very numerous et heterogeneous (demographics, radiomics, genomics, radiogenomics, etc.). The expectation would be to predict the effectiveness and tolerance of radiation therapy. With these new concepts, still at the preliminary stage, it is possible to create a personalized medicine which is always more secure and reliable. [ABSTRACT FROM AUTHOR]
Published: 2018
Full Text: View/download PDF

17. Identification de gènes impliqués dans les ataxies épisodiques par combinaison de séquençages génomique et transcriptomique

Author: Audet, Sébastien and Tétreault, Martine
Subjects: Transcriptomique, Génétique clinique, SpliceAI, ExpansionHunter, Bioinformatics, Integrative analysis, Ataxies, Génomique, Transcriptomic, Analyse intégrative, Genomic, Bio-informatique, Ataxia, Clinical genetics, RNA-seq, WGS
Abstract: Cette étude pilote vise à développer une méthode d'analyse intégrative qui permet d'augmenter le taux de réussite du diagnostic clinique des mutations génétiques rares. De plus, l'identification de nouveaux gènes associés à l'ataxie épisodique (EA) et l'évaluation de nouveaux algorithmes de prédiction, pour un examen de variants plus robuste, découleront de l'enquête. Caractérisé par une perte sporadique de la coordination des mouvements volontaires, l'EA se manifeste généralement tardivement, avec une hétérogénéité clinique et génétique élevée, compliquant largement l’obtention d’un diagnostic précis. Alors que quatre gènes ont été liés aux huit sous-types d'EA, de nombreux patients demeurent sans diagnostic moléculaire dû aux limites des méthodes de séquençage d’ADN. Ces lacunes accentuent l’intérêt d’implanter le séquençage de l’ARN en milieu clinique, afin d’obtenir l’information fonctionnelle offerte par l’approche. Des patients atteints d’EA, sans diagnostic moléculaire malgré un examen approfondi, ont été recrutés à Montréal. Le séquençage du génome entier (WGS) et de l'ARN a été effectué sur des échantillons de sang pour identifier les variants nucléotidiques, l'expression différentielle, les événements d'épissage ainsi que les expansions de microsatellites. Plusieurs algorithmes de prédiction de la pathogénicité récents ont été choisis pour être testés parallèlement aux algorithmes standard. Des données WGS provenant d’un trio familial atteint de pathologies neurologiques ont également été soumises au pipeline génomique développé pour la cohorte EA. Des variants candidats ont été identifiés pour chaque patient en fonction des scores de pathogénicité, de la rareté des événements génétiques et des informations fonctionnelles et cliniques connues pour un gène altéré donné. Parmi les découvertes figurent des mutations non-sens, des faux-sens, de l'épissage alternatif ainsi que des expansions nucléotidiques dans des gènes associés aux ataxies spinocérébelleuses ou aux paraplégies spastiques. En plus d'être présents dans les ensembles de données de séquençage disponibles pour chaque patient, les événements génomiques ont été vérifiés par séquençage Sanger de l'ADN et de l'ARN lorsque possible. Les effets fonctionnels potentiels, prédits principalement à partir du RNA-seq et suggérant une expression anormale de l'ARNm, ont également été évalués par amplification PCR et qPCR traditionnelle. À ce jour, quatre des dix patients ont reçu ou sont en voie de recevoir un diagnostic clinique, et quatre autres présentent d’excellents candidats moléculaires pour expliquer une pathologie ataxique. Ce projet devrait permettre un diagnostic mieux défini, conduisant à une meilleure qualité de vie, une meilleure évaluation du pronostic et une meilleure prise en charge des patients. L’identification de modulateurs génétiques chez certains d’entre eux devrait également permettre une meilleure caractérisation clinique des conditions rapportées, bénéficiant les évaluations symptomatiques futures. De plus, la méta-analyse des données RNA-seq offre le potentiel de découvrir des régulateurs de pathogenèse communs à l’EA. Il favorisera également l'approche intégrative pour un plus large éventail de troubles et pourrait éventuellement conduire à de nouvelles stratégies thérapeutiques., This pilot study aims to develop an integrative analysis method that allows for an increased diagnosis success rate of rare genetic mutations. Moreover, identification of novel genes associated with Episodic Ataxia (EA) and evaluation of new AI-generated prediction algorithms, for a more robust variant examination, will ensue from the investigation. Characterized by sporadic loss of voluntary movement coordination, EA typically manifest with a late onset as well as high-clinical and genetic heterogeneity, setting additional hurdles to diagnosis. While four genes have been linked to the eight subtypes of EA, many patients are left without molecular diagnosis due to the limitations of individual DNA-sequencing methods, which can be mitigated by the functional overview that RNA sequencing (RNA-seq) offers. EA patients, lacking molecular diagnosis despite in-depth examination, were recruited in Montreal. Whole-Genome sequencing (WGS) and RNA-seq were performed on blood samples to identify single nucleotide variants, differential expression, splicing events, structural variants and repeat expansions. Multiple recent pathogenicity prediction algorithms were chosen for testing concurrently to standard ones, in order to evaluate their performance and potential for clinical pipelines integration. WGS data of a family trio from France, in which the father and the daughter present neurologic pathologies, were also processed through the genomic pipeline that was developed for the EA cohort in order to identify the cause of their disorder. Candidate variants were identified for each patient according to pathogenicity scores, rarity of genetic events, and known functional as well as clinical information for a given altered gene. Among the findings are truncations, missenses, alternative splicing, and repeat expansions in genes already associated to either spinocerebellar ataxia or spastic paraplegia. In addition to being present in both datasets when available, validation of these interesting genomic events has been performed through Sanger Sequencing of both DNA and RNA when feasible. For strong candidates where the available functional information from RNA-seq suggests abnormal mRNA expression, validation includes PCR amplification as well as a traditional qPCR to support effects on transcripts. To this day, four out of ten patients have received or are on the verge of receiving a diagnosis, and four others are carrying excellent molecular candidates requiring further validation to explain their ataxic pathologies. This project should provide more defined diagnosis, leading to better quality of life, better evaluation of prognosis and better management of care for patients. Identification of genetic modifier in some of them should also allow for a better clinical characterization of the reported conditions, benefiting future patient examinations. A meta-analysis of our patients’ transcriptomic profiles could also uncover commonly affected pathways in EA development. It will also promote the integrative approach for a larger spectrum of disorders and might eventually lead to new therapeutic strategies.
Published: 2022

18. Inférences démographiques à partir de données génomiques sous des modèles spatialisés

Author: Virgoulay, Thimothée, Institut des Sciences de l'Evolution de Montpellier (UMR ISEM), Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-École Pratique des Hautes Études (EPHE), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Institut de recherche pour le développement [IRD] : UR226-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM), Université de Montpellier, and François Rousset
Subjects: [SDV.SA]Life Sciences [q-bio]/Agricultural sciences, Génomique, Modèle d'isolement par la distance, Génétique des populations, Population genetics, Isolation by distance models, Dispersal, Genomics, Dispersion, Méthode d'inférence par simulation, Inference by simulation method
Abstract: This thesis aims at presenting a set of concepts and inferential tools adapted to the analysis of neutral genetic polymorphism in a specific class of stochastic population genetics models : spatialized demographic models of populations where the dispersal of individuals between generations is limited in space (isolation by distance models). Such analysis is based on the combination of stochastic models of population evolution (generation by generation coalescence) and statistical inference method by simulation (“the summary-likelihood method”). In a first step various tools were developed and tested independently before being integrated together to create an inferential framework adapted to our models. In a second step, we used this framework to study the performances and benefits of these new inference methods and the influence of considering linkage disequilibrium patterns on parameter inference under distance isolation models.; Cette thèse a pour but de développer un ensemble de concepts et d’outils inférentiels adaptés à l’analyse du polymorphisme génétique neutre dans une classe bien spécifique de modèles stochastiques de génétique des populations : les modèles démographiques spatialisés de populations où la dispersion des individus entre générations est limitée dans l’espace (modèles d’isolement par la distance). Cette analyse repose sur la combinaison de modèles stochastiques de l’évolution des populations (la coalescence en génération par génération) et d’une méthode d’inférence statistique par simulation (“the summary-likelihood method”). Dans un premier temps, les divers outils furent mis au point et testés indépendamment avant d’être intégré ensemble afin de créer un canevas d’inférence reliant des outils adaptés à nos modèles. Dans un second temps nous avons utilisé ce canevas afin d’étudier les performances et les bénéfices de ces nouvelles méthodes d’inférences par simulation dans ce contexte d’isolement par la distance, notamment l’influence de la prise en compte des patrons de déséquilibre de liaison sur l’inférence des paramètres de densité et de dispersion.
Published: 2022

19. Plasma : plateforme d'e-learning pour l'analyse interactive de données

Author: Tuloup, Jérémy, Vandiedonck, Claire, Caburet, Sandrine, Poulain, Pierre, Poulain, Pierre, QuantStack, Institut Necker Enfants-Malades (INEM - UM 111 (UMR 8253 / U1151)), Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)-Université Paris Cité (UPC), Institut Jacques Monod (IJM (UMR_7592)), Centre National de la Recherche Scientifique (CNRS)-Université Paris Cité (UPC), Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)-Université Paris Cité (UPCité), and Centre National de la Recherche Scientifique (CNRS)-Université Paris Cité (UPCité)
Subjects: analyse de données, notebook, Plasma, open source, enseignement, [INFO.INFO-BI]Computer Science [cs]/Bioinformatics [q-bio.QM], pédagogie active, Jupyter, génomique, [INFO.INFO-BI] Computer Science [cs]/Bioinformatics [q-bio.QM]
Abstract: International audience; L’objectif de Plasma (https://plasmabio.org/) est de former des étudiants à l'exploration et à l'analyse de données massives, principalement issues d’expériences de génomique en biologie.Ce projet repose sur l'utilisation de notebooks Jupyter, véritables carnets électroniques interactifs, qui intègrent du code informatique, du texte, des équations mathématiques et la visualisation des résultats d'analyse sous forme de graphiques ou de tableaux. Cette technologie est en train dedevenir un standard pour l'analyse de données.Ces notebooks sont hébergés sur un serveur informatique performant basé sur l’écosytème open source Jupyter. Nous avons développé une évolution de cette technologie qui permet aux enseignants de créer des environnements informatiques adaptés à chaque enseignement.Les étudiants peuvent se connecter à distance quand et d’où ils le souhaitent pour effectuer leurs analyses dans un environnement convivial et performant.Nous avons utilisé une première fois Plasma de septembre 2020 à avril 2021, pour des cours de programmation Python, de programmation R et d’analyses de données génomiques. Malgré des conditions sanitaires difficiles, nos étudiants ont pu poursuivre leurs enseignements pratiques grâceà cette solution, qu’ils ont appréciée et plébiscitée. Nous utilisons depuis lors Plasma pour de nombreux enseignements.Ce projet est réalisé en collaboration avec QuantStack, une société fortement impliquée dans le développement de l'écosystème Jupyter. Plasma est open source, documenté et librement accessible.
Published: 2022

20. Génomique appliquée à l'étude des infections par les bactéries des genres Campylobacter et Helicobacter

Author: Jehanne, Quentin and STAR, ABES
Subjects: Genomique, Ngs, Helicobacter, Linux, Campylobacter, Genomics, Python, [INFO.INFO-BI] Computer Science [cs]/Bioinformatics [q-bio.QM]
Abstract: Intestinal and gastric bacterial infections caused by Campylobacter and Helicobacter bacteria are frequent: Campylobacter species can lead to severe gastroenteritis cases through the consumption of contaminated products such as meat and Helicobacter bacteria may be responsible of ulcers or gastric cancers. More than 200,000 campylobacteriosis cases are reported in the European Union each year. It has also been shown that about 50% of the world population is infected with Helicobacter pylori. A large number of Campylobacter strains and gastric biopsies from clinical cases are received daily at the French National Reference Center for Campylobacters and Helicobacter (NRCCH) where analyses such as species identification and antimicrobial resistance determination are performed. Several methods are used to study these pathogens: bacterial cultures, antibiograms, MALDI-TOF mass spectrometry and DNA extraction for real-time PCR. Despite the fact these analyses are cheap and quick, it may also introduce some disadvantages: for example species identification using MALDI-TOF is sometimes non-significant and the determination of molecular resistance mecanisms among resistant isolates can also be challenging. Today, next-gen sequencing is a crucial tool to generate a large amount of data and, combined with bioinformatics, can solve numerous clinical problems encountered in the laboratory. In order to modernize the analysis of French clinical cases performed at the NRCCH, various bioinformatic tools and scripts were set up and developped during this PhD. The main objective was to enrich our knowledge on these bacterial infections by highlighting DNA and protein sequences variations involved in various problematics. Over these three years, we have then identify: SNPs (Single Nucleotide Polymorphisms) within the genome of Campylobacter coli that are able to discriminate three different sources of contamination (chickens, cattle and pigs), new antimicrobial resistance genes that have emerged in France in the past few years but also new Campylobacter and Helicobacter species. These differents data and tools are now routinely used in the NRCCH laboratory. All these analyses were made possible by the use of Linux environment and Bash or Python programming languages allowing the study of thousands of DNA sequences from a variety of clinical isolates that have been sequenced throughout many projects. This «genomic exploration» was here the key to answer the different clinical issues., Les infections bactériennes intestinales et gastriques par les bactéries du genre Campylobacter et Helicobacter sont très fréquentes: l’une pouvant provoquer des gastro-entérites sévères des suites d’une contamination alimentaire (principalement la viande) et l’autre étant liée au développement d’ulcères ou bien de cancers gastriques. Plus de 200 000 cas de campylobacterioses sont recensés dans l’Union Européenne chaque année, avec comme principale espèce Campylobacter jejuni. De plus, environ 50% de la population mondiale est infectée par Helicobacter pylori. De très nombreuses souches de Campylobacter et de biopsies gastriques sont reçues quotidiennement au CNR des Campylobacters et des Hélicobacters (CNRCH) où y sont menées des analyses telles l’identification de l’espèce et de la résistance aux antibiotiques. Plusieurs méthodes sont mises en place pour étudier ces pathogènes : cultures bactériennes, antibiogrammes, spectromètre de masse MALDI-TOF et extraction d’ADN pour des PCR en temps réel. Malgré la rapidité et le moindre coût de ces méthodes, les utiliser en routine présente des désavantages notamment des identifications d’espèces parfois non concluantes avec le MALDI-TOF ou la difficulté de déterminer les mécanismes moléculaires de résistance. Aujourd’hui, le séquençage haut débit couplé à la bio-informatique permet de générer des données cruciales pour résoudre ces nombreuses problématiques rencontrées en laboratoire. C’est en vue de moderniser les analyses de cas cliniques français effectuées au CNRCH que différents outils et scripts bio-informatiques ont été mis en place mais aussi développés durant ce doctorat. Le principal objectif étant d’enrichir nos connaissances sur ces infections bactériennes : de mettre en évidence des variations dans les séquences d’ADN (gène et mutations) mais aussi protéiques impliquées dans diverses problématiques. Ainsi, il a pu être identifié durant ces trois années : des SNPs (Single Nucleotide Polymorphisms) dans le génome de Campylobacter coli spécifiques à trois différentes sources de contamination (la volaille, les bovins et les porcs), des nouveaux gènes de résistance aux antibiotiques qui émergent sur le territoire métropolitain mais aussi des nouvelles espèces du genre Helicobacter ou Campylobacter. Ces outils et données sont d’ores et déjà utilisés en routine au sein du CNRCH. Toutes ces analyses ont pu être possibles via l’utilisation de l’environnement Linux (progammation Bash et Python) permettant d’étudier des milliers de séquences d’ADN provenant d’une variété de souches séquencées au cours des différents projets. Cette «exploration génomique» fût ici la clé pour répondre aux différentes problématiques cliniques.
Published: 2022

21. Faut-il génotyper « nos bonnes vaches » ? Une approche de la génomique par les contradictions.

Author: MOUGENOT, CATHERINE and GAILLARD, CLAIRE
Abstract: Copyright of VertigO is the property of La Revue Electronique en Sciences de l'Environnement VertigO and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
Published: 2017
Full Text: View/download PDF

22. Phylodynamique des infections virales.

Author: Alizon, Samuel and Saulnier, Emma
Abstract: Phylodynamics is a recent field that aims at using genetic sequence data to estimate epidemiological parameters such as the viral population growth rate, the number of infections in the population or even their duration. Its main underlying assumption is that the way viruses spread leaves marks in their genome. In this review, we first introduce the originality of phylodynamics inferences compared to 'classical' phylogenetic approaches. Then, we present the novelty of using phylogenies of infections compared to species trees, while giving some directions to infer of such objects. We discuss the birth of phylodynamics and its first successes, in order to present some of the questions the approach can address. Finally, we highlight some future challenges for the field. [ABSTRACT FROM AUTHOR]
Published: 2017
Full Text: View/download PDF

23. Prise en charge des carcinomes ovariens de haut grade séreux et/ou endométrioïdes de stades avancés (III-IV) et testing HRD-BRCA en 2023 : actualisation selon les données publiées et/ou présentées en 2022.

Author: Selle F, Joly F, Gladieff L, Prulhière K, Leary A, Kalbacher E, Rouleau E, and Ray-Coquard I
Subjects: Female, Humans, Carcinoma, Ovarian Epithelial drug therapy, BRCA2 Protein genetics, Poly(ADP-ribose) Polymerase Inhibitors therapeutic use, Genomic Instability, Ovarian Neoplasms drug therapy, Ovarian Neoplasms genetics, Ovarian Neoplasms pathology
Abstract: Management of high grade, serous and/or endometrioid, advanced (stages III-IV) ovarian carcinomas and HRD-BRCA testing in 2023: update according to data published/presented in 2022 Molecular analysis of ovarian carcinomas must be now systematically performed to determine BRCA1 and BRCA2 status as well as genomic instability score. Several types of tests are available. From a clinical perspective, new data from phase III clinical trials presented in 2022 confirm the key role of PARP inhibitors in first-line medical treatment of high-grade serous ovarian cancers. A new algorithm that includes all new evidence is proposed for selection of first-line therapy., (Copyright © 2023 Elsevier Masson SAS. Tous droits réservés. All rights reserved.)
Published: 2023
Full Text: View/download PDF

24. Évolution de gènes de la vision et de l'olfaction chez les poissons à nageoires rayonnées

Author: Policarpo, Maxime, Evolution, génomes, comportement et écologie (EGCE), Institut de Recherche pour le Développement (IRD)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Institut des Neurosciences Paris-Saclay (NeuroPSI), Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Université Paris-Saclay, Didier Casane, and Sylvie Rétaux
Subjects: Génomique, [SDV.GEN.GA]Life Sciences [q-bio]/Genetics/Animal genetics, Vision, Evolution, [SDV.BID.EVO]Life Sciences [q-bio]/Biodiversity/Populations and Evolution [q-bio.PE], [SDV.BA.ZV]Life Sciences [q-bio]/Animal biology/Vertebrate Zoology, Genomic, Fishes, Poissons, Adaptation, Olfaction
Abstract: With about 35,000 described species, ray-finned fishes, also called actinopterygians, represent almost half of all vertebrate species and more than 95% of all aquatic vertebrates. These animals have colonized a large number of different environments, both in fresh and salt water, in temperatures ranging from zero to 35°C and at depths of up to 8000 meters. These highly heterogeneous ecological niches within a species group makes it particularly interesting to study the evolution of their sensory systems, which are involved in a number of essential functions such as navigation, feeding and reproduction. In this thesis, I undertook comparative genomic studies to better understand the evolution of olfaction across actinopterygians and vision in cave-dwelling actinopterygians. The detection of odorant molecules is ensured by olfactory receptors, proteins expressed on the surface of the membrane of the sensory neurons in the olfactory epithelium. This epithelium can display a more or less complex organization depending on the species, in particular by the presence of different numbers of lamellae, regulating the size of the exchange surface with the external environment. By analyzing the genome of 185 actinopterygians, we observed a great variability in the number of genes encoding olfactory receptors and a strong correlation between the size of this gene repertoire and the number of lamellae, probably because a large surface area of olfactory epithelium is necessary for a large number of receptors to be expressed. Thus, whereas polypterids (Erpetoichthys calabaricus and Polypterus senegalus) possess more than a thousand different receptors with an olfactory organ that consists of hundreds of lamellae, the sunfish (Mola mola) has only a median fold in a reduced olfactory epithelium and possesses only about thirty different receptors. These coherent morphological and molecular data suggest that the olfactory capacities are probably very variable between actinopterygians. In addition, we have studied the evolution of genes involved in photoreception in cave-dwelling fish with more or less degenerate eyes. By looking for the presence of loss-of-function mutations (mutations that makes a gene non-functional, a pseudogene), we have shown the presence of more or less numerous pseudogenes depending on the species, suggesting that photoreception genes are dispensable in these fishes living in the dark. Conversely, most genes involved in the circadian cycle and pigmentation are under purifying selection, probably because of their pleiotropy (genes involved in multiple biological processes). Only a few genes are recurrently pseudogenized in cavefishes, suggesting that they are dispensable in the darkness of caves and could often be involved in depigmentation and loss of circadian clock in caves. Using different methods relying on the analysis of selective shift on photoreception genes at the time of transition from surface to cave, we estimated that the cavefishes we studied are relatively recent, i.e. they colonized caves between the early Pliocene (~5 million years ago) and the late Pleistocene (~10,000 years ago).; Avec environ 35 000 espèces décrites, les poissons à nageoires rayonnées, ou actinoptérygiens, représentent environ la moitié des espèces de vertébrés et plus de 95% des vertébrés aquatiques. Ces animaux ont colonisé un grand nombre de milieux différents, que ce soit en eaux douces ou salées, à des températures de zéro à 35°C et à des profondeurs allant jusqu’à 8000 mètres. Cette grande hétérogénéité écologique au sein d’un groupe d’espèces rend particulièrement intéressant l’étude de l’évolution de leurs systèmes sensoriels qui sont impliqués dans un grand nombre de fonctions essentielles comme le déplacement, l’alimentation et la reproduction. Dans cette thèse, j’ai mené des études de génomique comparative afin de mieux comprendre l’évolution de l’olfaction chez les actinoptérygiens et de la vision chez des actinoptérygiens cavernicoles. La détection de molécules odorantes est assurée par les récepteurs olfactifs, protéines présentes dans la membrane des neurones sensoriels de l’épithélium olfactif. Cet épithélium peut avoir une organisation plus ou moins complexe en fonction de l’espèce, notamment par la présence d’un nombre différent de lamelles, ce qui fait varier la dimension de la surface d’échange avec le milieu extérieur. En analysant le génome de 185 actinoptérygiens, nous avons observé une grande variabilité du nombre de gènes codant les récepteurs olfactifs et une forte corrélation entre la taille de ce répertoire de gènes et le nombre de lamelles, probablement parce qu’une grande surface d’épithélium olfactif est nécessaire pour qu’un grand nombre de récepteurs puisse être exprimés. Ainsi, alors que les polyptères (Erpetoichthys calabaricus et Polypterus senegalus) possèdent plus d’un millier de récepteurs différents et que leur organe olfactif est constitué de centaines de lamelles, le poisson lune (Mola mola) ne présente qu’un repli médian au niveau d’un épithélium olfactif réduit et ne possède qu’une trentaine de récepteurs différents. Ces données, cohérentes au niveau morphologique et moléculaire, suggère que les capacités olfactives sont probablement très différentes entre actinoptérygiens. Par ailleurs, nous avons étudié l’évolution de gènes impliqués dans la photoréception chez des poissons cavernicoles qui ont des yeux plus ou moins dégénérés. En recherchant la présence de mutations perte de fonction (mutations qui rendent un gène non fonctionnel, ou pseudogène), nous avons montré la présence de pseudogènes plus ou moins nombreux en fonction des espèces considérées, et nous en avons déduit que les gènes de photoréception sont dispensables chez ces poissons vivant dans l’obscurité. En revanche, les gènes impliqués dans le cycle circadien et la pigmentation sont pour la plupart sous sélection purificatrice, probablement à cause de leur pléiotropie, c’est-à-dire leur implication dans de multiples processus biologiques. Seuls quelques gènes sont pseudogénisés de façon récurrente chez plusieurs espèces cavernicoles, suggérant qu’ils sont dispensables dans l’obscurité des grottes et seraient souvent impliqués dans la dépigmentation et la perte du cycle circadien dans les grottes. En utilisant différentes méthodes qui reposent sur l’analyse du changement de pression de sélection sur les gènes de la photoréception au moment du passage de la vie épigée à la vie hypogée, nous avons estimé que les poissons cavernicoles étudiés sont relativement récents, c’est-à-dire qu’ils ont colonisé des grottes entre le début du Pliocène (~5 millions d’années) et la fin du Pléistocène (~10 000 ans).
Published: 2021

25. Épidémiologie de le diphthérie en Nouvelle-Calédonie

Author: Tessier, Ève, Université de Bordeaux (UB), and Julien Colot
Subjects: Épidémiologie, Toxine diphtérique, Génomique, New Caledonia, Epidemiology, Corynebacterium diphtheriae, [SDV]Life Sciences [q-bio], Genomic, Diphtheria toxin, Nouvelle-Calédonie, [SDV.SP]Life Sciences [q-bio]/Pharmaceutical sciences
Abstract: Introduction: The increasing number of cases of isolation of Corynebacterium diphtheriae in New Caledonia, the potential severity of this infection and the consequences in terms of public health actions have prompted us to focus on this bacterial species and its local epidemiology. Material and method: A retrospective clinical study was conducted by consulting patient records for each of the 84 cases included. Among these cases, 58 were retained, for which the antibiograms were retested, the tox gene sought, the biovar determined, the strains sequenced and a phylogenetic tree carried out based on the core genome of our cohort. Results: We note a concentration of cases particularly around Nouméa and Lifou. 84% of samples were taken at skin level. Overall the strains present in the territory are sensitive to the majority of commonly used antibiotics. However, 27.9% of tetracycline-resistant strains were found. 63.7% of our strains belong to only two sublineages, few found elsewhere in the world. The vast majority of strains do not express diphtheria toxin, except for two episodes, one case and five cases, all imported from Vanuatu. Discussion: The evolution of the repositories used for the realization of antibiograms tends to make strains more often resistant without biological reality when the same technique is applied to all strains. Asymptomatic portages and incidental discoveries suggest that there is a significant number of tox - strains in New Caledonia, a potential reservoir in case of introduction of tox+ strains via Vanuatu for example. This should motivate particular attention to population immunization coverage.; Introduction : Le nombre croissant d’isolement de Corynebacterium diphtheriae relevé en Nouvelle-Calédonie, la potentielle gravité de cette infection et la répercussion en termes d’actions de santé publique à mettre en place nous ont incités à nous intéresser plus particulièrement à cette espèce bactérienne et à son épidémiologie locale. Matériel et méthode : Une étude clinique rétrospective a été réalisée par consultation des dossiers patients pour chacun des 84 épisodes inclus. Parmi ces cas, 58 ont été conservés, pour lesquelles les antibiogrammes ont été retestés, le gène tox recherché, le biovar déterminé, les souches séquencées et un arbre phylogénétique a été réalisé en se basant sur le core génome de notre cohorte. Résultats : Nous notons une concentration des cas en particulier autour de Nouméa et Lifou. 84 % des prélèvements ont été réalisés au niveau cutané. Les souches présentes sur le territoire sont globalement sensibles à la majorité des antibiotiques couramment utilisés. On note cependant 27,9 % de souches résistantes à la tétracycline. 63,7 % de nos souches appartiennent à seulement deux sublineages, peu retrouvés ailleurs dans le monde. Les souches dans leur grande majorité n’expriment pas la toxine diphtérique, excepté deux épisodes, de 1 cas et 5 cas, tous importés du Vanuatu. Discussion : L’évolution des référentiels utilisés pour la réalisation des antibiogrammes tend à rendre les souches plus souvent résistantes sans réalité biologique lorsque l’on applique la même technique à toutes les souches. Des portages asymptomatiques et découvertes fortuites font penser qu’il y a un nombre important de souches tox- en Nouvelle-Calédonie, réservoir potentiel en cas d’introduction de souches tox+ via le Vanuatu par exemple. Cela doit susciter une attention particulière en ce qui concerne la couverture vaccinale de la population.
Published: 2021

26. Caractérisation de deux familles de pharmacogènes, les gènes CYP3A et CYP4F

Author: Richard-St-Hilaire, Alex and Hussin, Julie
Subjects: Génomique, Transcriptomique, Génétique des populations, CYP4F, Population genetics, Bioinformatics, CYP3A, Bio-informatique, Genomics, Transcriptomics, Cytochromes P450
Abstract: Les cytochromes P450 (CYP450) sont des hémoprotéines intervenant généralement dans la détoxication de l’organisme sous forme de biodégradation de molécules xénobiotiques et participent à la décomposition de certains médicaments. Cependant, les gènes codant pour les protéines CYP450 sont souvent sous-analysés dans les études génomiques à grande échelle en raison de leur difficulté d’analyse due à un haut taux de polymorphisme. Deux sous-familles seront étudiées plus en profondeur: les sous-familles CYP3A et CYP4F. La sous-famille CYP3A métabolise environ 50% des médicaments alors que les enzymes CYP4F, quant à eux, sont impliquées dans le métabolisme de composés endogènes, de nutriments et de médicaments. Les gènes de ces sous-familles sont fortement polymorphes et ce, à travers les populations humaines. Ainsi, la variabilité entre les différentes populations peut affecter la réponse aux médicaments et autres fonctions métaboliques. Dans ce projet, deux grands jeux de données, l’un en génétique des populations (le Projet des 1000 Génomes) et l’autre en transcriptomique (GTEx) seront utilisés afin d’identifier des signatures de sélection naturelle dans les gènes CYP3A et CYP4F, ainsi que leur impact sur l’expression génique de ces gènes. Nous avons détecté différentes forces de sélection (positive et balancée) dans les deux sous-familles. Certains polymorphismes identifiés comme étant sous pression sélective sont associés à une expression différentielle des gènes des deux sous-familles. Ce projet permet de mieux comprendre l’impact des mutations sous pression sélective se situant dans les gènes des sous-familles CYP3A et CYP4F. Cette caractérisation génétique permettra d’obtenir des prédictions plus fiables en pharmacogénomique et en génomique humaine, en raison de l’influence de ces gènes sur la réponse aux médicaments., Cytochromes P450 (CYP450) are hemoproteins generally involved in the detoxification of the body of xenobiotic molecules and participate in the metabolism of many drugs. Genetic polymorphisms have been found to impact drugs responses and metabolic functions. However, genes encoding CYP450 proteins are often under-analyzed in large-scale genomic studies because the difficulty of analysis due to of their high rate of polymorphism. In this study, we investigate the genetic diversity for CYP450 genes. We found that two clusters, CYP3A and CYP4F, are notably differentiated across human populations with evidence for selective pressures acting on both clusters. The CYP3A subfamily metabolizes approximately 50\% of drugs while CYP4F enzymes are involved in the metabolism of endogenous compounds, nutrients and drugs. Indeed, we found signals of recent positive selection in CYP3A and CYP4F genes and signals of balancing selection in CYP4F genes. Futhermore, unusual linkage disequilibrium is detected in both cluster, suggesting co-evolution. eQTLs were also found in both clusters which indicate co-regulation and epistasis.
Published: 2021

27. Nouvelle stratégie d'annotation des génomes par l'utilisation d'algorithmes d'intelligence artificielle

Author: Scalzitti, Nicolas, Laboratoire des sciences de l'ingénieur, de l'informatique et de l'imagerie (ICube), École Nationale du Génie de l'Eau et de l'Environnement de Strasbourg (ENGEES)-Université de Strasbourg (UNISTRA)-Institut National des Sciences Appliquées - Strasbourg (INSA Strasbourg), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Les Hôpitaux Universitaires de Strasbourg (HUS)-Centre National de la Recherche Scientifique (CNRS)-Matériaux et Nanosciences Grand-Est (MNGE), Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut de Chimie du CNRS (INC)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut de Chimie du CNRS (INC)-Centre National de la Recherche Scientifique (CNRS)-Réseau nanophotonique et optique, Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS), Université de Strasbourg, Julie Maaloum, and Pierre Collet
Subjects: Artificial intelligence, Évolution artificielle, Annotation de génome, Deep learning, Genomics, Intelligence artificielle, Genetic programming, Splice site, Génomique, Programmation génétique, Sites d’épissage, Artificial evolution, [SDV.MHEP]Life Sciences [q-bio]/Human health and pathology, Genome annotation
Abstract: High-throughput genome sequencing projects produce a huge amount of raw biological data on a daily basis. However, the data are difficult to exploit if they are not annotated. Unfortunately, the currently available genome annotation programs are still too prone to prediction errors, making genome annotation one of the major challenges in bioinformatics. In this context, my thesis is organized around three connected topics: i) improving the prediction of eukaryotic protein-coding genes by focusing on splice sites ii) exploiting artificial intelligence algorithms (convolutional neural networks and evolutionary algorithms), iii) training with high quality data from a wide range of eukaryotic organisms (from humans to protists). The strategy developed consists in combining the processed and validated data set (G3PO) with the developed programs (Spliceator and SpliceSLEIA) in order to improve gene prediction by decreasing the error rate so that they no longer propagated in public databases. This work should contribute to a better understanding of organisms and their biological mechanisms.; Les projets de séquençage à haut débit produisent une énorme quantité de données biologiques brutes. Cependant, elles sont difficilement exploitables si elles ne sont pas annotées. Pour traiter ces données, des programmes d’annotation de génomes ont été développés, mais ces derniers sont encore trop sujet aux erreurs de prédiction, faisant de l’annotation des génomes un des défis majeurs en bio-informatique. Dans ce contexte, mes travaux de thèse s’organisent autour d’un trinôme : 1) l’amélioration de la prédiction des gènes eucaryotes codant pour des protéines en se focalisant spécifiquement sur les sites d’épissage 2) en exploitant des algorithmes d’intelligence artificielle (CNN et algorithmes évolutionnaires), 3) entraînés avec des données de haute qualité incluant une forte diversité d’espèces eucaryotes. Notre stratégie consiste à combiner l’ensemble des données validées avec les programmes développés afin d’améliorer la prédiction des gènes en diminuant le taux d’erreurs et éviter qu’elles ne se propagent dans les bases de données. De plus, ces travaux permettront une meilleure compréhension des organismes et de leurs mécanismes biologiques.
Published: 2021

28. New strategy for genome annotation using artificial intelligence algorithms

Author: Scalzitti, Nicolas, Laboratoire des sciences de l'ingénieur, de l'informatique et de l'imagerie (ICube), École Nationale du Génie de l'Eau et de l'Environnement de Strasbourg (ENGEES)-Université de Strasbourg (UNISTRA)-Institut National des Sciences Appliquées - Strasbourg (INSA Strasbourg), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Les Hôpitaux Universitaires de Strasbourg (HUS)-Centre National de la Recherche Scientifique (CNRS)-Matériaux et Nanosciences Grand-Est (MNGE), Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut de Chimie du CNRS (INC)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut de Chimie du CNRS (INC)-Centre National de la Recherche Scientifique (CNRS)-Réseau nanophotonique et optique, Université de Strasbourg (UNISTRA)-Université de Haute-Alsace (UHA) Mulhouse - Colmar (Université de Haute-Alsace (UHA))-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS), Université de Strasbourg, Julie Maaloum, Pierre Collet, and STAR, ABES
Subjects: Artificial intelligence, [SDV.MHEP] Life Sciences [q-bio]/Human health and pathology, Évolution artificielle, Annotation de génome, Deep learning, Genomics, Intelligence artificielle, Genetic programming, Splice site, Génomique, Programmation génétique, Sites d’épissage, Artificial evolution, [SDV.MHEP]Life Sciences [q-bio]/Human health and pathology, Genome annotation
Abstract: High-throughput genome sequencing projects produce a huge amount of raw biological data on a daily basis. However, the data are difficult to exploit if they are not annotated. Unfortunately, the currently available genome annotation programs are still too prone to prediction errors, making genome annotation one of the major challenges in bioinformatics. In this context, my thesis is organized around three connected topics: i) improving the prediction of eukaryotic protein-coding genes by focusing on splice sites ii) exploiting artificial intelligence algorithms (convolutional neural networks and evolutionary algorithms), iii) training with high quality data from a wide range of eukaryotic organisms (from humans to protists). The strategy developed consists in combining the processed and validated data set (G3PO) with the developed programs (Spliceator and SpliceSLEIA) in order to improve gene prediction by decreasing the error rate so that they no longer propagated in public databases. This work should contribute to a better understanding of organisms and their biological mechanisms., Les projets de séquençage à haut débit produisent une énorme quantité de données biologiques brutes. Cependant, elles sont difficilement exploitables si elles ne sont pas annotées. Pour traiter ces données, des programmes d’annotation de génomes ont été développés, mais ces derniers sont encore trop sujet aux erreurs de prédiction, faisant de l’annotation des génomes un des défis majeurs en bio-informatique. Dans ce contexte, mes travaux de thèse s’organisent autour d’un trinôme : 1) l’amélioration de la prédiction des gènes eucaryotes codant pour des protéines en se focalisant spécifiquement sur les sites d’épissage 2) en exploitant des algorithmes d’intelligence artificielle (CNN et algorithmes évolutionnaires), 3) entraînés avec des données de haute qualité incluant une forte diversité d’espèces eucaryotes. Notre stratégie consiste à combiner l’ensemble des données validées avec les programmes développés afin d’améliorer la prédiction des gènes en diminuant le taux d’erreurs et éviter qu’elles ne se propagent dans les bases de données. De plus, ces travaux permettront une meilleure compréhension des organismes et de leurs mécanismes biologiques.
Published: 2021

29. Le Centre International de Ressources Microbiennes (CIRM), une infrastructure de Centres de Ressources microBiologique (mCRB) aux dimensions nationales et européenne au service de la recherche agronomique et environnementale

Author: Mistou, Michel-Yves, Favel, Anne, Helloin, Emmanuelle, Legras, Jean-Luc, Portier, Perrine, Valence, Florence, Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas] (MaIAGE), Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Biodiversité et Biotechnologie Fongiques (BBF), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Infectiologie et Santé Publique (UMR ISP), Université de Tours (UT)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Sciences Pour l'Oenologie (SPO), Université de Montpellier (UM)-Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro), Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Institut de Recherche en Horticulture et Semences (IRHS), Université d'Angers (UA)-AGROCAMPUS OUEST, Science et Technologie du Lait et de l'Oeuf (STLO), AGROCAMPUS OUEST, Société Française de Microbiologie, Université de Tours-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), Université de Montpellier (UM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut Agro - Montpellier SupAgro, Université d'Angers (UA)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-INSTITUT AGRO Agrocampus Ouest, and Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-INSTITUT AGRO Agrocampus Ouest
Subjects: centre de ressource microbiologique, [SDV]Life Sciences [q-bio], conservation, Collections, [SDV.MP.BAC]Life Sciences [q-bio]/Microbiology and Parasitology/Bacteriology, génomique, biodiversité
Abstract: International audience; Le CIRM est un groupement d’intérêt scientifique (GIS) géré par INRAe, associant L’institut Agro et les universités d’AixMarseille, Angers, Montpellier et Tours. Les cinq mCRB qui constituent le CIRM gèrent des collections spécialisées,stratégiques dans les domaines agronomique, agro-alimentaire, biotechnologique et environnemental.Le CIRM préserve, enrichit, caractérise et valorise cette diversité microbienne et propose un ensemble de services et prestations :- Données génomiques, moléculaires, taxonomiques, phénotypiques et écologiques- Développements méthodologiques pour le criblage d’activités et la sélection- Service de dépôt confidentiel pour la conservation de souchesCIRM-Champignons filamenteux (CIRM-CF) : Plus de 2000 souches, représentatives de 500 espèces de champignons ligno-cellulolytiques, Basidiomycètes et Ascomycètes. La biodiversité enzymatique associée nourrit des projets decaractérisation et de valorisation dans les biotechnologies vertes et blanches.CIRM-Bactéries associées aux plantes (CIRM-CFBP) : héberge aujourd’hui plus de 7000 accessions (63 genres). L’ensemble des taxons de bactéries pathogènes de plantes sont représentés et font l’objet de projets de séquençageet de phénotypage à haut-débit.CIRM-Bactéries pathogènes des animaux ou de l’homme (CIRM-BP) : La collection regroupe des souches de 65 genres de bactéries pathogènes de classe 2 et 3 isolées de l’animal, de l’homme ou de l’environnement, qui permettent lamise en place de cribles d’activités antibactériennes.CIRM-Bactéries d’intérêt agro-alimentaires (CIRM-BIA) : Les collections du CIRM-BIA regroupent plus de 4000 souches appartenant à 30 genres et 150 espèces différentes. Le CIRM-BIA caractérise la biodiversité́ à des finsd’innovation dans le domaine agro-alimentaire.CIRM-Levures : Plus de 4000 isolats de levures Saccharomycotina et Basidiomycota, (63 genres) issues de fermentations traditionnelles et d’environnements variés. Son implication dans la génomique place le CIRM-Levuresà la pointe de la recherche en taxonomie et évolution des levures.Certifié ISO 9001 depuis 2008, le CIRM a reçu le label IBISA en tant qu’infrastructure en Biologie Santé et Agronomie.Le CIRM pilote le pilier microbien de l’infrastructure nationale AgroBRC-RARe inscrite sur la feuille de route nationale des infrastructures du MESRI. Le CIRM est également membre fondateur de l’Infrastructure paneuropéenne MIRRIERIC, qui permet l’accès à un large éventail de ressources, de données et de services dans le domaine microbiologique.
Published: 2021

30. Algorithms for probabilistic motif search: the case of dinucleotidic Position Weight Matrices (di-PWM)

Author: Mille, Marie, Méthodes et Algorithmes pour la Bioinformatique (MAB), Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier (LIRMM), Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM), Université de Montpellier, and Flagship project GEM from Labex NUMEV
Subjects: python, logiciel, [INFO.INFO-DS]Computer Science [cs]/Data Structures and Algorithms [cs.DS], motifs, PWM, recherche, [INFO.INFO-BI]Computer Science [cs]/Bioinformatics [q-bio.QM], indexation, bioinformatique, [SDV.BIBS]Life Sciences [q-bio]/Quantitative Methods [q-bio.QM], algorithme, di-PWM, génomique
Abstract: Chaque facteur de transcription se lie à diverses séquences d'ADN ressemblantes, mais pas identiques, entre elles. Cet ensemble de séquences cibles peut être représenté par un motif probabiliste tel qu'une Matrice Poids Position (Position Weight Matrix en anglais -- PWM). Une PWM comporte un nombre de colonnes égal à la longueur des motifs identifiés par des méthodes expérimentales, et un nombre de lignes égal à 4 (pour A, T, G ou C). Chaque colonne stocke la probabilité d'apparition de chacun des 4 nucléotides possibles pour chaque position des séquences cibles. Dans une PWM, les colonnes sont indépendantes les unes des autres : ce modèle ne peut transcrire entre positions voisines. Pour dépasser cette limitation, Kulakovskiy et al. ont proposé les dinucleotidic PWM, où chaque colonne stocke la probabilité de tous les di-nucléotides possibles (AA, AC, AG, etc.). Dans ce travail de Master, nous proposons différents algorithmes génériques pour rechercher les occurrences de di-PWM dans un texte qui représente une longue séquence d'ADN ou d'ARN. En particulier, nous proposons des accélérations pour une stratégie dite de fenêtre glissante, où l'on scanne le texte afin de trouver une fenêtre dont le score selon la matrice est supérieur à un seuil donnée. Ensuite, nous exhibons un algorithme en deux étapes : d'abord, l'énumération des mots valides (mots dont le score et suffisant) avec une approche par séparation et évaluation, puis la recherche simultanée et exacte de ces mots valides dans le texte. Nous comparons nos implémentations de ces algorithmes entre elles et montrons qu'elles sont utilisables en pratique. En particulier, l'algorithme par énumération s'avère rapidement le plus efficace, même en comparaison à un outil existant, puisque sa complexité est proportionnelle aux nombre d'occurrences produit en sortie. Les fonctions de recherche de di-PWM sont implantées dans un module en langage Python, d'installation et d'utilisation faciles, qui sera prochainement mis à disposition de la communauté sous licence libre.
Published: 2021

31. Congrès de l’association américaine de recherche contre le cancer — AACR 2016.

Author: Vicier, C., De Guillebon, E., Kieffer, A., Turpin, A., Dumont, C., Bellesoeur, A., Soares, D. G., and Lotz, J. P.
Abstract: This year, the theme of the American Association for Cancer Research (AACR) conference that held from the 16th to the 20th of April 2016 was “Delivering Cures through Cancer Science”. Its objective was to reinforce the link existing between research and advances in patient’s care. As usual, the multidisciplinary program covered all the areas of cancer science. Beyond the plenary sessions and symposiums, the program of the meeting included didactic educational workshops on specific areas of research offering a good opportunity to learn or to extend knowledge on particular issues. The meeting also permitted active discussion and exchanges with colleagues through the poster sessions. In this issue of Oncologie, and for the third year in a row, mentoring medical doctors of the French association, AERIO (Association d’enseignement et de recherche des internes d’oncologie) focus on presentations that, to our opinion, warranted a particular attention. The aim of this exciting and informative project is not only to provide details to researchers and physicians but also to the general public who could not attend the conference. This year, genetic and epigenetic cancer heterogeneity as well as tumor immunology received a particular and still increasing attention by the AACR steering committee. However, we also report here the most recent advances on tumor metabolism and its signaling pathways, a rapidly growing research field that should allow, in the near future, to identify potential drug targets and to develop compounds capable of starving and inhibiting tumor progression. [ABSTRACT FROM AUTHOR]
Published: 2016
Full Text: View/download PDF

32. Coxiella burnetii, agent de la fièvre Q.

Author: Boarbi, Samira, Fretin, David, and Mori, Marcella
Abstract: Q fever is a zoonosis of worldwide distribution with the exception of New Zealand. It is caused by an intracellular bacterium, Coxiella burnetii. The disease often goes underdiagnosed because the main manifestation of its acute form is a general self-limiting flu-like syndrome. The Dutch epidemics renewed attention to this disease, which was less considered before. This review summarizes the description of C. burnetii (taxonomy, intracellular cycle, and genome) and Q fever disease (description, diagnosis, epidemiology, and pathogenesis). Finally, vaccination in humans and animals is also considered. [ABSTRACT FROM AUTHOR]
Published: 2016
Full Text: View/download PDF

33. Quoi de neuf en recherche fondamentale et translationnelle sur le cancer du pancréas ?

Author: Buscail, L. and Bournet, B.
Abstract: The challenge of the basic and translational research on pancreatic adenocarcinoma is not only to obtain a better understanding in the biology of the pancreatic cancer cells and in the microenvironment but also in the different faces of the disease: resectable versus unresectable, metastatic versus locally advanced, and short versus long survivors. The recent studies summarized in the present review aimed to investigate at a large scale genome, exome, and transcriptome. These works attempted to isolate different molecular profiles depending on the prognosis, the activation of oncogene/tumor suppressor genes, and on the response to chemotherapy. The second set of studies is focused on the microenvironment of the pancreatic cancer. This microenvironment plays a key role in the invasive and metastatic process of pancreatic carcinoma with a strong relationship between cancerous cells and pancreatic stellate cells, as well as extracellular matrix. All these works are based on the transgenic mice KRAS-G12D models after crossing or not with other transgenic models bearing a knock out of various tumor suppressor genes. All these studies concluded that targeting the microenvironment significantly influences the prognosis and the response to chemotherapy. This targeting aims to modify the modeling of tumoral stroma (matrix, vascularization) and to inhibit secretion of pancreatic stellate cells. All these new molecular profiles and biomarkers should be validated on prospective clinicobiological cohorts and with early therapeutic phases. [ABSTRACT FROM AUTHOR]
Published: 2015
Full Text: View/download PDF

34. Définition et applications cliniques des radiomics.

Author: Bourgier, C., Colinge, J., Aillères, N., Fenoglietto, P., Brengues, M., Pèlegrin, A., and Azria, D.
Abstract: Résumé L’objectif initial en radiothérapie oncologique est de proposer une personnalisation thérapeutique en ayant une analyse fine de la tumeur notamment à l’échelle moléculaire en prenant en compte la susceptibilité individuelle notamment de réactivité des tissus sains à plus ou moins long terme. Radiomics permet une analyse qualitative et quantitative ultraperformante, consistant en l’extraction à haut débit de données numériques d’imagerie médicale afin d’obtenir des informations prédictives et/ou pronostiques concernant les patients pris en charge pour une pathologie cancéreuse. Une approche différente permet de définir la radiomics comme une information biologique somatique ou constitutionnelle qui modifiera la prise en charge par radiothérapie. Elle inclut la susceptibilité individuelle des tissus sains mais également la réponse potentielle de la tumeur à une radiothérapie. Ces « omics » sont des techniques biologiques à haut débit, permettant d’identifier et d’explorer simultanément un ensemble de gènes, lipides, protéines ou autres sujets d’étude de façon compartimentée. The ultimate goal in radiation oncology is to offer a personalized treatment to all patients indicated for radiotherapy. Radiomics is a tool that reinforces a deep analysis of tumors at the molecular aspect taking into account intrinsic susceptibility in a long-term follow-up. Radiomics allow qualitative and quantitative performance analyses with high throughput extraction of numeric radiologic data to obtain predictive or prognostic information from patients treated for cancer. A second approach is to define biological or constitutional that could change the practice. This technique included normal tissue individual susceptibility but also potential response of tumors under ionizing radiation treatment. These “omics” are biological and technical techniques leading to simultaneous novel identification and exploration a set of genes, lipids, proteins. [ABSTRACT FROM AUTHOR]
Published: 2015
Full Text: View/download PDF

35. Impact des éléments transposables sur l'évolution de la régulation des gènes : exemple du sexe chez les poissons téléostéens

Author: Dechaud, Corentin, Institut de Génomique Fonctionnelle de Lyon (IGFL), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Université de Lyon, Jean-Nicolas Volff, École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), and STAR, ABES
Subjects: Evolution, [SDV.BBM.BM]Life Sciences [q-bio]/Biochemistry, Molecular Biology/Molecular biology, Genomics, [SDV.BBM.BM] Life Sciences [q-bio]/Biochemistry, Molecular Biology/Molecular biology, Gene regulatory networks, Sexe, Génomique, Poissons téléostéens, [SDV.BBM.GTP]Life Sciences [q-bio]/Biochemistry, Molecular Biology/Genomics [q-bio.GN], Eléments tranposables, [SDV.BBM.GTP] Life Sciences [q-bio]/Biochemistry, Molecular Biology/Genomics [q-bio.GN], Sex, Réseaux de régulation, RNA-seq, [INFO.INFO-BI]Computer Science [cs]/Bioinformatics [q-bio.QM], Transposable elements, Teleost fish, [INFO.INFO-BI] Computer Science [cs]/Bioinformatics [q-bio.QM]
Abstract: In teleost fish, sexual reproduction and sexual gene regulatory networks are highly variable. In gonochoristic species, sex is determined either environmentally or genetically and can involve different genes depending on the species investigated. Sexual development and maintenance appear also variable in this clade. To understand the origin of this diversity, I studied the posssible impact of transposable elements on the fast evolution of gene regulatory networks related to sex in fish. Transposable elements are endogenous DNA sequences able to move or copy themselves in genomes. Even if they are often deleterious for their host, transposable elements can also carry regulatory sequences, such as transcription factor binding sites, and spread them in genomes. Their diversity in fish genomes form a source of ready-to-use regulatory sequences potentially involved in the fast evolution of some gene regulatory networks.To test this hypothesis, I used RNA sequencing data from male and female gonads of the Japanese Medaka, Oryzias latipes. First I analysed gene and transposable element expression and discovered regions of the genome enriched in sex-biased genes associated to sex-biased transposable elements. Moreover, genes and transposable elements located close on chromosomes tend to present similar expression bias between testis and ovary. Two hypothesis that are not mutually exclusive can explain this observation : either transposable element influence gene expression of neighbooring genes, or the genomic locus where the transposable element inserts influence its expression. We were not able to definitively discriminate between these two hypotheses, but our work identified several clues for a regulatory role of transposable elements. In the second part and in a complementary way I found transposable element families physically enriched near to sex-biased genes. One family was further investigated and shown to carry transcription factor binding sites involved in sexual function.This work brings new insights on the possible role of transposable elements in the fast evolution of gene regulatory networks and paves the way for future functionnal studies., Chez les poissons téléostéens, les modes de reproduction sexuée et les réseaux de régulation des gènes liés au sexe sont très variables. La détermination du sexe des espèces gonochoriques, par exemple, peut être aussi bien génétique qu'environnementale et peut impliquer des gènes différents selon les espèces. Les régulations du développement et du maintien du sexe apparaissent également variables dans ce groupe. Pour essayer de comprendre l'origine de cette diversité, je me suis intéressé à l'impact possible des éléments transposables sur la régulation de gènes liés au sexe chez ces poissons. Bien que souvent neutres, et parfois délétères pour leur hôte, les éléments transposables peuvent aussi transporter des séquences régulatrices, comme des sites de fixation de facteurs de transcription, et les disséminer à travers les génomes. Pour tester cette hypothèse, j'ai utilisé des données de séquençage d'ARN issues de gonades mâles et femelles d'Oryzias latipes, le médaka japonais. Dans un premier temps, j'ai analysé l'expression des gènes et des éléments transposables et mis en évidence des régions du génome enrichies en gènes et éléments transposables différentiellement exprimés entre les gonades mâles et femelles. De plus, les gènes et les éléments transposables proches le long des chromosomes ont tendance à présenter des biais d'expression similaires. Deux hypothèses, non mutuellement exclusives, peuvent rendre compte de cette observation : d'une part, les éléments transposables pourraient modifier l'expression des gènes voisins, et d'autre part, l'environnement génomique du site d'insertion pourrait influencer l'expression des éléments transposables. Les travaux réalisés ne permettent pas de trancher définitivement entre ces deux hypothèses, mais plusieurs observations sont en faveur d'un rôle régulateur de certains éléments transposables. Dans un deuxième axe et de manière complémentaire, j'ai mis en évidence des familles d'éléments transposables physiquement enrichies dans l'environnement des gènes sexe-biaisés. Une famille candidate a été étudiée plus en détail, et j'ai pu mettre en évidence dans ces éléments des sites de fixation de facteurs de transcription connus pour être impliqués dans la fonction sexuelle. Ces travaux montrent ainsi le rôle potentiel des éléments transposables dans l'évolution rapide de certains réseaux de régulation de gènes et serviront de socle pour de futures études fonctionnelles.
Published: 2021

36. Une histoire génétique : notre diversité, notre évolution, notre adaptation

Author: Quintana-Murci, Lluis and Fischer, Alain
Subjects: PSAK, Multidisciplinary, SCI086000, PSAJ, diversité biologique, génétique des populations, SCI000000, génétique, génomique, génomique humaine, PSA, SCI, SCI029000, épidémiologie, SCI027000, immunologie, PD, évolution, diversité phénotypique, diversité
Published: 2021

37. Diversité des bactéries halophiles dans l'écosystème fromager et étude de leurs impacts fonctionnels

Author: Kothe, Caroline, MICrobiologie de l'ALImentation au Service de la Santé (MICALIS), AgroParisTech-Université Paris-Saclay-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Université Paris-Saclay, and Pierre Renault
Subjects: Potentiel fonctionnel, Metagenomic, Génomique, High-Throughput sequencing, Halophiles, Séquençage haut débit, Halophilic, Genomic, [SDV.BBM]Life Sciences [q-bio]/Biochemistry, Molecular Biology, Halotolerant, Functional potential, Halotolérants, Métagénomique
Abstract: Halophilic and halotolerant bacteria are usually isolated in natural environments, although they are also present in foods such as cheese rinds and seafood. However, studies on their ecological and technological functions in cheese are still underdeveloped. In order to fill the data gap in the literature on this subject, we have used cultural, genomic and metagenomic approaches to deconstruct these ecosystems in cheese rinds. The cultural approach, assisted by the development of targeted strategies to facilitate the isolation of sub-dominant species, allowed us to isolate representatives of 28 species, including four new species of Halomonas and two of Psychrobacter. Based on a mapping with the genomes of halophilic species available as reference on more than 100 cheese rind metagenomes, we showed that gamma-proteobacteria, mainly from the genera Halomonas, Psychrobacter and Pseudoalteromonas, are abundant in a wide variety of soft and washed-rind cheeses. Since this fact suggests that these microorganisms could play a technological role in foods, we evaluated, in parallel with strains from other environments, their ability to produce aromatic compounds and pigments in a synthetic cheese model. These experiments showed that these Gammaproteobacteria could have a technological impact in addition to their ecological role. The results obtained in this work should stimulate the development of functional studies of this salt-tolerant flora in the cheese ecosystem.; Les bactéries halophiles et halotolérantes sont généralement isolées dans des environnements naturels, bien qu'elles soient également présentes dans les aliments, comme les croûtes de fromage et les fruits de mer. Cependant, les études sur leurs fonctions écologiques et technologiques dans le fromage sont encore peu développées. Afin de combler le manque de données dans la littérature sur ce sujet, nous avons utilisé des approches culturales, génomiques et métagénomiques pour déconstruire ces écosystèmes dans les croûtes de fromages. L’approche culturale, assistée par le développement de stratégies ciblées pour faciliter l’isolement des espèces sous-dominantes, nous a permis d'isoler des représentants de 28 espèces, dont quatre nouvelles espèces d’Halomonas et deux de Psychrobacter. À partir d’un mapping avec les génomes des espèces halophiles disponibles comme références sur plus de 100 métagénomes de croûtes de fromages, nous avons montré que les gamma-protéobactéries, principalement des genres Halomonas, Psychrobacter et Pseudoalteromonas, sont abondantes dans une grande variété de fromages à pâte molle et croûte lavée. Comme ce fait suggère que ces microorganismes pourraient exercer un rôle technologique dans les aliments, nous avons évalué, en parallèle avec des souches issues d’autres environnements, leurs capacités à produire des composés aromatiques et des pigments dans un modèle de fromage synthétique. Ces expériences ont montré que ces gamma-protéobactéries pourraient avoir un impact technologique en plus de leur rôle écologique. Les résultats obtenus dans ce travail devraient stimuler le développement d’études fonctionnelles de cette flore tolérante au sel dans l’écosystème fromager.
Published: 2021

38. GENOMIQUE ET LIPIDES Génomique et métabolisme des lipides des plantes

Author: Delseny Michel, Verdoucq Lionel, Maisonneuve Sylvie, and Roscoe Thomas
Subjects: métabolisme lipidique, semences, séquençage systématique, génomique, Oils, fats, and waxes, TP670-699
Abstract: Il existe dans les bases de données publiques une énorme quantité de séquences d’ADN dérivées de plantes, et notamment la séquence complète du génome d’Arabidopsis thaliana, une plante modèle pour les oléagineux, proche parente du colza. Ces données constituent une ressource importante non seulement pour la compréhension de métabolisme lipidique et de sa régulation, mais aussi pour la sélection et le développement de variétés nouvelles d’oléagineux produisant davantage d’huiles ou des huiles de composition nouvelle. Cette abondance de séquences peut être exploitée, en utilisant les recherches d’homologies, pour identifier les gènes, pour obtenir des informations sur leur fonction, comme pour repérer des gènes candidats codant des fonctions nouvelles. L’analyse de ces bases de données a révélé que la majeure partie des gènes codant des enzymes impliquées dans le métabolisme lipidique appartient à des petites familles multigéniques, reflétant la diversification des fonctions des isoformes. Une analyse du catalogue des ADNc séquencés en aveugle reflète les niveaux d’expression des différents gènes et fournit un aperçu des régulations des flux au travers des voies métaboliques conduisant à la biosynthèse des lipides de réserve. La disponibilité de mutants et de lignées transgéniques d’Arabidopsis et le développement de puces à ADN qui permettent l’analyse simultanée de plusieurs milliers de gènes conduiront à une meilleure compréhension des facteurs qui régulent le métabolisme des huiles dans les graines. Une telle connaissance facilitera la manipulation de la composition des huiles et des quantités produites dans les graines.
Published: 2002
Full Text: View/download PDF

39. Biotechnologies

Author: Rival Alain, Tregear James, Jaligot Estelle, Morcillo Fabienne, Aberlenc Frédérique, Billotte Norbert, Richaud Frédérique, Beule Thierry, Borgel Alain, and Duval Yves
Subjects: Elaeis guineensis Jacq., épigénétique, embryogenèse somatique, génomique, marqueurs moléculaires, sélection assistée par marqueurs, Oils, fats, and waxes, TP670-699
Abstract: Today, a range of biotechnological approaches, from somatic embryogenesis to biomolecular research, play an increasingly important role in breeding strategies for oil palm (Elaeis guineensis Jacq.). Clonal micropropagation. Methods of cloning by in vitro culture led to the development of a micropropagation technique for oil palm based on somatic embryogenesis which was tested at the pilot stage on elite genotypes, thus enabling the production of high oil yielding clones. This phase allowed the identification of limiting factors associated with scaling-up, with respect in particular to the scale of mass production required to meet the needs of planters and to the problem of ensuring genetic fidelity in the regenerated plant material. These two concerns led researchers to look further into the underlying physiological and/or molecular mechanisms involved in somatic embryogenesis and the somaclonal variation events induced by the in vitro cloning procedure. Structural and functional genomics. Marker-assisted breeding in oil palm is a long-term multi-stage project including: molecular analysis of genetic diversity in both E. guineensis and E. oleifera germplasms; large scale development of PCR-based microsatellite markers; and parallel development of three genome mapping and QTL detection projects studying key agronomic characters. Post-genomics. In order to tackle the problem of the mantled flowering abnormality, which is induced during the micropropagation process, studies of gene expression have been carried out in tissue cultures as a means of establishing an early clonal conformity testing procedure. It is important to assess what kind of methodology is the most appropriate for clonal conformity testing by comparing RNA, protein and DNA (PCR) based approaches. Parallel studies on genomic DNA methylation changes induced by tissue culture suggest that the latter may play an important role in the determination of the mantled abnormality.
Published: 2001
Full Text: View/download PDF

40. Évolution intra-hôte de Vibrio cholerae et interactions avec le microbiome intestinal

Author: Levade, Inès and Shapiro, Jesse
Subjects: métagénomique, metagenomics, machine learning, hypermutation, within-host evolution, genomics, évolution intra-hôte, microbiome, cholera, apprentissage machine, Vibrio cholerae, choléra, génomique
Abstract: Le choléra est une infection diarrhéique aiguë qui représente encore aujourd’hui un grave problème de santé publique dans les pays où l’accès à l’eau potable et un système d’assainissement adéquat ne peut pas être garanti. Vibrio cholerae, le pathogène bactérien responsable de cette maladie, peut provoquer toute une série de symptômes chez les individus infectés, allant d’une diarrhée intense conduisant à une déshydratation sévère, au portage asymptomatique de la bactérie. Bien que notre compréhension du choléra à une échelle macro-épidémiologique a considérablement été améliorée par le développement des techniques de séquençage à haut débit et par les avancées dans le domaine de la génomique bactérienne, aucune étude n’a encore été menée pour caractériser son évolution à l’échelle des individus infectés. De plus, le rôle des porteurs asymptomatiques au sein d’une épidémie et la raison derrière l’absence de symptômes chez ces individus infectés sont encore méconnus. L’objectif principal de cette thèse est donc de (1) caractériser la diversité génomique de V. cholerae au niveau des individus et des cercles familiaux, mais aussi (2) d’évaluer le rôle potentiel du microbiome intestinal dans la susceptibilité de contracter cette maladie entérique aiguë et de présenter des symptômes sévères. Dans un premier temps, nous caractérisons la diversité génomique de colonies isolées à partir de patients symptomatiques. Le séquençage de génomes entiers de souches provenant de patients du Bangladesh et d’Haïti révèle que cette diversité sous la forme de mutations ponctuelles reste limitée, mais détectable au sein des hôtes. Une grande partie de la variation du contenu génétique semble être surtout due au gain et à la perte de phages et de plasmides au sein de la population de V. cholerae, avec des échanges occasionnels entre le pathogène et d’autres membres commensaux du microbiote intestinal. Cela contredit l’hypothèse couramment acceptée que les infections par V. cholerae sont majoritairement clonales, et confirme que le transfert horizontal de gènes est un facteur important dans l’évolution de V. cholerae. De plus, nos résultats montrent que certains de ces variants peuvent avoir un effet phénotypique, impactant par exemple la formation de biofilms, et peuvent être sélectionnés au sein des individus infectés. Par la suite, nous appliquons une association de méthodes de séquençage de génomes entiers et de méthodes métagénomiques afin d’améliorer la détection des variants intra-hôte, à la fois chez des patients symptomatiques, mais aussi chez des porteurs asymptomatiques. Notre étude montre que l’approche métagénomique offre une meilleure résolution dans la détection de la diversité dans la population microbienne, mais reste difficile à appliquer chez des patients asymptomatiques, en raison du faible nombre de cellules de V. cholerae chez ces patients. Dans l’ensemble, nous constatons que le niveau de diversité au sein de la population bactérienne intra-hôte est similaire entre les patients symptomatiques et asymptomatiques. Nous détectons aussi la présence de souches hypermutantes chez certains patients. De plus, alors que les mutations chez les patients porteurs de phénotypes d’hypermutations ne semblent pas sous l’effet de la sélection, des signes d'évolution parallèle sont détectés chez les patients présentant un plus faible nombre de mutations, suggérant des mécanismes d’adaptation au sein de l’hôte. Nos résultats soulignent la puissance de la métagénomique combinée au séquençage de génomes entiers pour caractériser la diversité intra-hôte dans le cas d’une infection aiguë du choléra, mais aussi dans le cas de portage asymptomatique, tout en identifiant pour la première fois le phénotype d’hypermutation chez des patients infectés. Finalement, nous nous intéressons aux facteurs liés à la susceptibilité à la maladie et à la sévérité des symptômes. Basée sur une étude récente utilisant le séquençage 16S pour montrer le lien potentiel entre le microbiome intestinal et la susceptibilité à l’infection par V. cholerae, nos analyses utilisent les méthodes de séquençage métagénomique sur les mêmes échantillons de cette précédente étude afin de caractériser les profils taxonomiques et fonctionnels du microbiome intestinal de contacts familiaux exposés à V. cholerae. Les échantillons sont prélevés avant l’infection de ces contacts familiaux et l’apparition ou non de symptômes, et sont analysés pour identifier des prédicteurs à la maladie symptomatique. Grâce à un algorithme d’apprentissage machine, nous pouvons identifier des espèces, des familles de gènes et des voies métaboliques du microbiome au moment de l'exposition à V. cholerae pour détecter des biomarqueurs potentiels corrélés avec les risques d'infection et la gravité des symptômes. Nos résultats montrent que l’utilisation du séquençage métagénomique améliore la précision et l’exactitude des prévisions par rapport au séquençage 16S. Nos analyses permettent aussi de prédire la gravité de la maladie, bien qu’avec une plus grande incertitude que la prédiction de l’infection. Des taxons bactériens des genres Prevotella et Bifidobacterium ont été identifiées comme des marqueurs potentiels de protection contre l’infection, tout comme gènes impliqués dans le métabolisme du fer. Nos résultats soulignent le pouvoir de la métagénomique pour prédire l’évolution des maladies et identifient des espèces et des gènes spécifiques pouvant être impliqués dans des tests expérimentaux afin d’étudier les mécanismes liés au microbiome intestinal expliquant la potentielle protection contre le choléra., Cholera is an acute diarrhoeal disease that remains a global threat to public health in countries where access to safe water and adequate sanitation cannot be guaranteed. Vibrio cholerae, the bacterial pathogen responsible for this disease, can cause a range of symptoms in infected individuals, from intense diarrhea leading to severe dehydration, to asymptomatic carriage of the bacteria. Although our understanding of cholera on a macro-epidemiological scale has been considerably improved by the development of high-throughput sequencing techniques and by advances in bacterial genomics, no studies have yet been conducted to characterize its evolution at the scale of infected individuals. Furthermore, the role of asymptomatic carriers in an epidemic and the reason behind the absence of symptoms in these infected individuals remains unknown. The main objective of this thesis is therefore to characterize the genomic diversity of V. cholerae at the level of individuals and households, but also to evaluate the potential role of the gut microbiome in the susceptibility to contract this acute enteric disease and to present severe symptoms. First, we characterize the genomic diversity of colonies isolated from symptomatic patients. The whole genome sequencing of strains from patients in Bangladesh and Haiti reveals that this diversity is detectable in the form of point mutations within hosts, but remains limited. Much of the variation detected within patients appears to be due to the gain and loss of phages and plasmids within the V. cholerae population, with occasional exchanges between the pathogen and other commensal members of the gut microbiota. These results challenge the commonly accepted assumption that V. cholerae infections are predominantly clonal, and confirm that horizontal gene transfer is an important factor in the evolution of V. cholerae. In addition, our results show that some of these variants may also have a phenotypic effect, for example by impacting biofilm formation, and can be selected within infected individuals. Next, we apply a combination of whole genome sequencing and metagenomic approaches to improve the detection of intra-host variants, both in symptomatic patients and in asymptomatic carriers. Our study shows that the metagenomic approach offers a better resolution in the detection of the diversity in the microbial population, but remains difficult to apply in asymptomatic patients, due to the low number of V. cholerae cells in these individuals. Overall, we find that the level of diversity within the intra-host bacterial population is similar between symptomatic and asymptomatic patients. We also detect the presence of hypermutator strains in some patients. In addition, while mutations in patients with hypermutator phenotypes did not appear to be driven by selection, signs of parallel evolution are detected in patients with fewer mutations, suggesting adaptive mechanisms within the host. Our results underline the power of metagenomics combined with whole genome sequencing to characterize intra-host diversity in acute cholera infection, but also in asymptomatic carriers, while identifying for the first time an hypermutator phenotype in infected patients. Finally, we are interested in factors related to susceptibility to the disease and related to the severity of symptoms. Based on a recent study using 16S rRNA amplicon sequencing to show the potential link between the intestinal microbiome and susceptibility to V. cholerae infection, our study uses metagenomic sequencing methods on the same samples from this previous study to characterize the taxonomic and functional profiles of the gut microbiome of household contacts exposed to V. cholerae. Samples are collected prior to infection of these household contacts, and used to identify predictors of symptomatic disease. Using a machine learning algorithm, we can identify species, gene families and metabolic pathways in the microbiome at the time of exposure to V. cholerae to detect potential biomarkers correlated with risk of infection and symptom severity. Our results show that the use of metagenomic sequencing improves the precision and accuracy of predictions compared to 16S rRNA amplicon sequencing. Our analyses also predict disease severity, although with greater uncertainty than the prediction of infection. Bacterial taxa from the genera Prevotella and Bifidobacterium have been identified as potential markers of protection against infection, as well as genes involved in iron metabolism. Our results highlight the power of metagenomics to predict disease progression and identify specific species and genes that could be involved in experimental tests to study the mechanisms related to the microbiome explaining potential protection against cholera.
Published: 2021

41. Sélection bayésienne de variables pour données longitudinales avec effets différentiels dans le temps : application à l'amélioration génétique

Author: Heuclin, Benjamin
Subjects: amélioration génétique, U10 - Informatique, mathématiques et statistiques, Phénotype, Modèle linéaire, F30 - Génétique et amélioration des plantes, génomique, Théorie bayésienne, longitudinal studies [EN], Génotype
Abstract: En agronomie et plus spécifiquement en amélioration génétique, le génotypage haut débit a été largement mis à profit, depuis maintenant plus de 20 ans, pour accéder à une information génétique toujours plus riche et abondante. Celle-ci a permis d'identifier les positions le long du génome impliquées dans la variabilité de caractères d'intérêt. Plus récemment, les méthodes de phénotypage haut débit ont fait leur apparition. Elles donnent accès au suivi de l'évolution de plusieurs caractères phénotypiques au cours du temps. Ces données, longitudinales, permettent d'étudier finement la dynamique évolutive de ces caractères tout en identifiant les facteurs environnementaux qui influencent leur variabilité selon les stades de développement. Cependant, l'analyse de telles données soulève plusieurs défis statistiques. Cette thèse propose des développements méthodologiques afin de prendre en compte les dépendances entre observations et entre variables, de sélectionner les variables génétiques ou environnementales pertinentes, ou encore d'estimer des effets qui évoluent au cours du temps. Le cadre bayésien est un formalisme statistique élégant pour répondre à ces différentes problématiques notamment au travers de la construction de lois a priori. Nous étudions et comparons différentes lois a priori pour simultanément inférer et sélectionner les effets fixes et/ou aléatoires quand ceux-ci peuvent être nombreux. Nous considérons différents cadres de modélisation statistique classiquement utilisés pour l'analyse de données longitudinales. En particulier, nous nous focaliserons sur les modèles à coefficients variants, les modèles linéaires mixtes ou encore la régression sur signal. Ce travail a été motivé par différentes applications pratiques portant sur l'évolution temporelle de l'architecture génétique, la détection de QTL ou l'impact des variations climatiques sur la variabilité phénotypique. Trois jeux de données, issus de contextes agronomiques variés, sont utilisés pour illustrer ces nouvelles approches.
Published: 2021

42. Caractéristiques biologiques, écologie spatiale et structure de la population de raies manta de récif (mobula alfredi) de Nouvelle-Calédonie

Author: Lassauce, Hugo
Subjects: Génomique, Télémétrie satellite, Connectivité, Connectivity, Loyalty, Participatory science, Satellite telemetry, Science participative, Genomics, Photo-identification, 591.68, Fidélité
Abstract: Espèce emblématique et néanmoins menacée qui peuple les mers des régions tropicales et subtropicales du monde entier, la raie manta de récif (Mobula alfredi) est bien présente en Nouvelle-Calédonie. La population de l’archipel n’a cependant encore jamais été étudiée et la compréhension de sa biologie, son écologie, sa dynamique des populations et ses mouvements est encore limitée à l’échelle globale. L’acquisition de connaissances de références pourrait jouer un rôle essentiel pour la conservation de l’espèce. Cette thèse tente de décrire la population, sa structure et l’écologie spatiale de raies manta de Nouvelle-Calédonie en utilisant des approches diverses combinant la science participative à la télémétrie satellite et la génomique. Un suivi de cinq ans permettant la collecte de 1741 photo-identifications de raies manta a permis de connaitre les caractéristiques et la distribution de la population, d’estimer son abondance et d’obtenir un premier aperçu de son utilisation de l’espace et des potentielles sources de blessures. L’utilisation de 21 balises satellites a permis d’obtenir des données de déplacements et de comportements de plongées plus. Finalement, le séquençage du génome de 92 échantillons dont 73 provenant de quatre sites en Nouvelle-Calédonie et 19 de deux sites sur la côte Est de l’Australie a permis de révéler l’existence d’une structure génétique à l’échelle régionale et locale. Les résultats présentés dans cette thèse apportent les premières données sur la population de raies manta de récifs en Nouvelle-Calédonie et proposent les mesures et précautions qui devraient être prises pour évaluer et mitiger les possibles perturbations présentes et futures., Emblematic and threatened species distributed in the tropical and subtropical regions throughout the world, the reef manta ray is also represented in New Caledonia. The population of the archipelago has yet never been studied before and the understanding on the biology, ecology, populations dynamics and movements of the species remain globally limited. The acquisition of a knowledge of reference is essential for the conservation of the species. This thesis aims to describe the population, its structure, and the spatial ecology of reef manta rays of New Caledonia using diverse approaches combining citizen science, satellite telemetry, and genomic. A five-year monitoring allowed the collection of 1741 photo-identifications of manta rays from 11 sites distributed around the archipelago revealing the characteristics and the distribution of the population, an estimation of the abondance and a first insight into its habitat use and the potential source of injuries. The deployment of 21 satellite tags at three study sites recorded detailed data on horizontal movements and the vertical behaviour. Finally, the use of genome-wide single nucleotide polymorphisms (SNPs) discovered from of 92 samples, including 73 from four sites around New Caledonia and 19 from two sites on the east coast of Australia, revealed the existence of genetic structure at regional and local scales. The results presented in this thesis provide the first data on the population of reef manta rays of New Caledonia and suggest precautions and measures that should be considered to evaluate and mitigate the potential present and future disturbances.
Published: 2021
Full Text: View/download PDF

43. Etude de l’activité transpositionnelle chez le genre Oryza à l’ère des nouvelles technologies de séquençage

Author: Carpentier, Marie-Christine and STAR, ABES
Subjects: Génomique, Bioinformatics, Bio-Informatique, Next generation sequencing, Genomic, [SDV.BBM.GTP] Life Sciences [q-bio]/Biochemistry, Molecular Biology/Genomics [q-bio.GN], Rice, Nouvelles technologie de séquençage, Transposable elements, Riz, Éléments transposables
Abstract: Transposable elements (TEs) are ubiquitous components of eukaryotic genomes. They are mobile DNA sequences, which have the ability to multiply and move within the chromosomes of most living organisms. They belong to two classes: class I, retrotransposons and class II, transposons. Retrotransposons are predominant in plants.With the advancement of new sequencing technologies in the last decades, it is now possible to study the structural and functional impact of these elements in natural populations. Nevertheless, due to their repeated nature, the detection of polymorphisms associated with the activity of these elements is conceptually and technically challenging.During my PhD, I developed a pipeline (TRACKPOSON) allowing the detection of polymorphic insertions of transposable elements (in particular retrotransposons) in large datasets that I applied to the 3,000 available rice genomes.This study revealed a very dynamic transpositional landscape within the species. Based on these results, an association analysis (GWAS) was conducted to identify possible genetic factors related to transpositional activity. This analysis revealed the presence of a "master" copy of the element itself, a copy necessary for the activation of transposition in the family.The TE insertion polymorphisms for all 3000 genomes also enabled us to elucidate the origin of rice domestication. We were able to identify at least three distinct genetic origins of the cultivated species.In a second step, we studied the impact of insertions of these transposable elements on certain agronomic traits (TE-GWAS). We found that an insertion of the retrotransposon rn215-125 had a significant impact on grain width in Indica rice varieties. Using Nanopore long-read sequencing technology, we were able to characterize the region into which the insertion is located and propose that the allele conferring a wider grain is more likely to result from an introgression event from a donor yet to be identified, although our initial results suggest that it may be the wild relative O. rufipogon.The analyses conducted during my thesis show the strong contribution of transposable elements to genome dynamics in the population of 3000 rice varieties. Moreover, the constant evolution of sequencing technologies and the development of associated bioinformatics tools now open new perspectives for the analysis of structural variations and in particular the impact of transposable elements on the evolution of genomes within populations.Keywords : transposable elements, Oryza sativa, genomics, bioinformatics, big data, next generation sequencing technologies, genome-wide association studies (GWAS), Les éléments transposables (ET) sont des composants ubiquitaires des génomes eucaryotes. Ce sont des séquences d’ADN mobile, qui ont la capacité de se multiplier et de se déplacer au sein des chromosomes de la plupart des organismes vivants. Ils appartiennent à deux classes : la classe I, des rétrotransposons et la classe II, des transposons. Les rétrotransposons sont prédominants chez les plantes.Avec l’avancée des nouvelles technologies de séquençage ces dernières décennies, il est maintenant possible d’étudier l’impact structural et fonctionnel de ces éléments au sein de populations naturelles. Néanmoins par leur nature répétée, la détection des polymorphismes associés à l’activité de ces éléments est un défi conceptuel et technique.Au cours de ma thèse, j’ai développé un pipeline (TRACKPOSON) permettant la détection des insertions polymorphiques d’éléments transposables (en particulier les rétrotransposons) au sein de grand jeux de données que j’ai appliqué aux 3,000 génomes de riz disponibles.Cette étude a permis de mettre en évidence un paysage transpositionnel très dynamique au sein de l’espèce. A partir de ces résultats, afin d’identifier d’éventuels facteurs génétiques liés à l’activité transpositionnelle, une analyse d’association (GWAS) a été conduite. Celle-ci a permis de mettre en évidence la présence d’une copie « maître » de l’élément lui-même, copie nécessaire à l’activation de la transposition de la famille. Les données de polymorphismes d’insertion des ETs pour l’ensemble des 3000 génomes nous ont également permis d’élucider l’origine de la domestication du riz. Nous avons en effet pu mettre en évidence au moins trois origines génétiques distinctes de l’espèce cultivée.Dans un second temps, nous avons étudié l’impact des insertions de ces éléments transposables sur certains caractères agronomiques (TE-GWAS). Nous avons mis en évidence qu’une insertion du rétrotransposon rn215-125 avait un impact significatif sur la largeur des grains des variétés de riz Indica. Grâce à l’utilisation de la technologie de séquençage longues lectures Nanopore, nous avons pu caractériser la région dans laquelle se trouve l’insertion et proposons que l’allèle conférant un grain plus large proviendrait plutot d’un évènement d’introgression à partir d’un donneur qui reste à identifier, bien que nos premiers résultats suggèrent qu’il pourrait s’agir de l’espèce sauvage apparentée O. rufipogon.Les analyses conduites au cours de ma thèse permettent de mettre en évidence la forte contribution des éléments transposables sur la dynamique des génomes au sein de la population de 3000 variétés de riz. De plus, l’évolution constante des technologies de séquençage et le développement des outils bioinformatique associés, ouvrent maintenant de nouvelles perspectives pour l’analyse des variations structurales et en particulier l’impact des éléments transposables sur l’évolution des génomes au sein des populations.Mots-clés : éléments transposables, Oryza sativa, génomique, bio-informatique, grand jeux de données, nouvelles technologie de séquençage, étude génomique d’association (GWAS)
Published: 2021

44. Contribution à l'étude génomique des histoires démographique et adaptative des bovins et ovins de l'Océan Indien

Author: Magnier, Jessica
Subjects: Bovin, Ovin, Évolution, L10 - Génétique et amélioration des animaux, Bos taurus, génomique, génétique animale, genomic features [EN], Variation phénotypique
Abstract: The Indian Ocean represents a central migration zone for bovine (Bos taurus) and ovine (Ovis aries) populations accompanying human populations between East Africa, the Middle East and Southeast Asia, but their genetic diversity as well as their demographic and adaptive histories remain poorly known. The main objective of the thesis was to study the demographic and adaptive histories of cattle and sheep in the Indian Ocean, based on medium and high density genotyping data, with particular attention to the breeds of the western part of the zone located on the island of Mayotte, in the Comoros (never before phenotypically and genetically characterized) and on the island of Madagascar. For this purpose, a first phenotypic characterization was conducted on the sheep and cattle populations of Mayotte, allowing to highlight their phenotypic heterogeneity and to contribute to the recognition of the Zebu breed of Mayotte as a local French breed. This phenotypic characterization revealed a malformation of the external ear in 20% of the studied sheep, which present reduced or totally atrophied ears (microtia). The study of SNP-HD data of current cattle from Mayotte and Madagascar by comparing them to those of a larger panel of breeds representative of the bovine genetic diversity of the world has allowed to highlight a great genetic proximity (predominantly indicine ancestry and weak African taurine ancestry) between these two breeds, having diverged in the 16th century, at the time of the arrival of the Europeans. Their common ancestral population is the result of a crossbreeding event involving an African zebu population (African taurine x zebu) and an Indian index population dating back to the 12th century. A sharp increase in the size of the estimated populations is observed between the 16th and 17th centuries and coincides with the expansion of the livestock trade to supply European ships in particular. The origin of the cattle populations of the western Indian Ocean islands reflects the complex history of human migration and trade in this area. The Mayotte sheep population, which is close to the African fat-tailed sheep, is genetically homogeneous and would have undergone two peaks of inbreeding in the first half of the 20th century and another later one about ten years ago. An association analysis allowed us to locate a candidate mutation responsible for the microtia phenotype in the vicinity of the HMX1 gene, which is associated with the same type of malformation in Awassi and Altay sheep, and Highland cattle. For each population, the search for selection signatures and functional annotation on candidate genes allowed us to determine the main biological functions impacted by natural and artificial selection. At the Indian Ocean scale, we completed the search for selection signatures in the genome of 17 cattle breeds and 9 sheep breeds of the coast (SNP50K data), by GEA analyses, which facilitate the identification of genetic variants associated with population environmental covariates. Functional annotation of candidate genes associated with 6 climatic covariates in both species identified key biological functions associated with the climate of the area. Of the regions under selection identified in both species, only two regions contain genes associated with a climate variable (mean annual precipitation). Taken together, these results highlight the genetic originality of the Indian Ocean cattle and sheep breeds and specify the chromosomal regions, genes and biological functions/pathways involved in the adaptation of these breeds to the specific environmental conditions of this geographical area.
Published: 2021

45. Development of new methods and algorithms for the processing of UMI in high throughput sequencing data

Author: Sater, Vincent, STAR, ABES, Laboratoire d'Informatique, de Traitement de l'Information et des Systèmes (LITIS), Institut national des sciences appliquées Rouen Normandie (INSA Rouen Normandie), Institut National des Sciences Appliquées (INSA)-Normandie Université (NU)-Institut National des Sciences Appliquées (INSA)-Normandie Université (NU)-Université de Rouen Normandie (UNIROUEN), Normandie Université (NU)-Université Le Havre Normandie (ULH), Normandie Université (NU), Normandie Université, Thierry Lecroq, and Philippe Ruminy
Subjects: Fusion transcripts, Transcriptomique, [INFO.INFO-DB]Computer Science [cs]/Databases [cs.DB], Séquençage à haut débit, Simulation de reads, Genomics, UMI, Transcrits de fusion, Expression génique, Génomique, Read simulation, Next generation sequencing, Variant calling, [INFO.INFO-DB] Computer Science [cs]/Databases [cs.DB], Gene expression, Transcriptomics
Abstract: The objectives of this thesis fall within the broad issue of processing data from next generation sequencers, and more particularly short reads from second-generation sequencers. The aspects addressed in this issue mainly focus on the development of new methodologies based on unique molecular sequences called UMI used to label the initial DNA fragments and to improve the precision of the results.First of all, in the field of transcriptomics, a new method has been developed in order to improve the results of measuring gene expression on the one hand, and to detect fusion transcripts in tumors on the other hand. This method is based on an RT-MLPA coupled to an NGS sequencer. It makes it possible to amplify the RNA fragments from a tumor sample and to obtain the sequences of the analyzed fragments. The underlying analysis aims to analyze these sequences one by one in order, first, to assign each sequence to the corresponding sample, and secondly, to find the name of the gene it expresses. For this, RT-MiS has been developed. RT-MiS is a tool that is able to perform the entire analysis starting with the extraction and correction of the UMI from the sequences until the production of the results in the form of an gene expression matrix for each sample. RT-MiSalso includes a dedicated analysis interface allowing for the tool to be launched easily by the users. This interface automates the entire analysis process as much as possible and produces the results in the form of interactive figures and graphs making biological interpretation much easier.Then, in the field of genomics, a new somatic variant detection tool was developed. The UMI-VarCal tool is a UMI-based variant caller that implements a UMI analysis to efficiently call the variants in tumor samples. The utility of using the information from the UMI is highlighted by the improved accuracy of variant detection, especially when the frequency falls below 1%. UMI-VarCal applies a Poisson test to filter out non-variant positions and then applies a UMI analysis and two complementary filters to remove false positives. UMI-VarCal has been designed in a highly optimized manner allowing it to perform its analysis while remaining more efficient than other tools in terms of variant detection and execution time.Finally, and still in the field of variant detection, a new read simulator was developed. This tool called UMI-Gen is the first read simulator capable of generating sequences with UMI. In addition, UMI-Gen is capable of inserting somatic variants (SNV) or structural variants (CNV) into the simulated files. Furthermore, by analyzing a set of normal files, it is able to estimate the background noise in these samples and reproduce it in the simulated data. These files can be used later to evaluate different variant callers, especially those implementing a UMI analysis in their algorithm., Les objectifs de cette thèse s’inscrivent dans la large problématique du traitement des données issues de séquenceurs à très haut débit, et plus particulièrement des reads courts, issus de séquenceurs de deuxième génération. Les aspects abordés dans cette problématique se concentrent principalement sur le développement de nouvelles méthodologies se basant sur des séquences moléculaires uniques appelées UMI utilisées pour étiqueter les fragments d’ADN initiaux et permettant d’améliorer la précision des résultats obtenus.Tout d’abord, dans le domaine de la transcriptomique, une nouvelle méthode a été développée afin d’améliorer les résultats de mesure de l’expression génique d’une part, et de détecter les transcrits de fusion dans les tumeurs d’autre part. Cette méthode se base sur une RT-MLPA couplée à un séquenceur NGS. Elle permet d’amplifier les fragments d’ARN présents dans un échantillon tumoral et d’obtenir les séquences des fragments récoltés. L’analyse sous-jacente vise à analyser ces séquences une par une pour, dans un premier temps, attribuer chaque séquence à l’échantillon séquencé, et dans un deuxième temps, retrouver le nom du gène qu’il exprime. Pour cela, RT-MiS a été développé. RT-MiS est un outil permettant d’effectuer la totalité de l’analyse commençant par l’extraction et la correction des UMI des séquences jusqu’à la production des résultats sous forme de matrice d’expression par gène pour chaque échantillon. RT-MiS comporte aussi une interface d’analyse dédiée permettant de lancer l’outil facilement par les chercheurs. Cette interface permet d’automatiser le plus possible le processus d’analyse complet et de produire les résultats sous formes de figures et graphiques interactifs rendant l’interprétation biologique plus facile.Ensuite, dans le domaine de la génomique, un nouvel outil de détection de variants somatiques a été développé. L’outil UMI-VarCal est un variant caller basé sur les UMI et donc implémentant une analyse de ces derniers pour appeler efficacement les variants dans les échantillons tumoraux. L’utilité des UMI est mise en évidence par l’amélioration de la précision de détection des variants, surtout quand la fréquence tombe au-dessous de 1%. UMI-VarCal applique un test de Poisson pour filtrer les positions ne présentant pas des variants et puis se sert d’une analyse des UMI et de deux filtres complémentaires pour filtrer les faux positifs. UMI-VarCal a été conçu de façon très optimisée afin d’effectuer son analyse tout en restant plus efficace que les autres outils en termes de détectionde variants et de temps d’exécution.Finalement, et toujours dans le domaine de la détection des variants, un nouveau simulateur de reads a été développé. Cet outil appelé UMI-Gen est le premier simulateur de reads capable de générer des séquences avec des UMI. De plus, UMI-Gen est capable d’insérer des variants somatiques (SNV) ou des variants structuraux (CNV) dans les fichiers simulés. En outre, en analysant un ensemble de fichiers normaux, il est capable d’estimer le bruit de fond dans ces échantillons pour le reproduire dans les reads simulés. Ces fichiers peuvent être utilisés par la suite pour évaluer les variant callers, surtout ceuximplémentant une analyse UMI dans leur algorithme.
Published: 2021

46. Combinaisons, caractéristiques et origines de mécanismes de résistance aux (bio)insecticides chez des insectes ravageurs des cultures

Author: Siegwart, Myriam and STAR, ABES
Subjects: [SDV.SA] Life Sciences [q-bio]/Agricultural sciences, Molecular target, Cible moléculaire, Virus entomopathogène, Natural extract, Enzymatic assay, Genomics, Biotests, Genetic bases, Durability, Génomique, Resistance mechanism, Entomopathogenic virus, Dosage enzymatique, Mécanisme de résistance, Bases génétiques, Extrait naturel, Détoxication, Detoxification, Durabilité
Abstract: Some insects, when subjected to high insecticide pressure, develop the ability to survive these toxins. This adaptive phenomenon called insecticide resistance is an example of microevolution. Through the study of various biological models I have addressed questions concerning (i) the types of resistance mechanisms and their importance in the development of field management strategies; (ii) the anticipation and study of resistance to biocontrol products in order to increase their sustainability; and (iii) the genetic basis of resistance. Studies conducted on two lepidopteran pests: Grapholita molesta (Tortricidae) and Ostrinia nubilalis (Pyralidae) highlight complex and variable resistance mechanisms between populations, based on panels of combinations of increased activity of detoxification enzymes and mutation in the molecular target of the insecticide. Research on the pre-existence of resistance to two natural plant extracts (3,5-dicaffeoyl quinic acid and dicaffeoyl tartaric acid) with aphicidal properties in several aphid species showed (i) small differences in susceptibility between clones or populations of Myzus persicae (Aphididae) possibly related to the size of the individuals (ii) insensitivity of one clone of Aphis craccivora (Aphididae). No cross-resistance between synthetic insecticides and these natural extracts was detected. Research on the cost of resistance in Cydia pomonella (Tortricidae) to Cydia pomonella GranuloVirus isolate M (CpGV-M), a widely used biopesticide, showed a low cost limiting the possibilities of managing this resistance. Finally, the genomic study of the genetic basis of resistance in C. pomonella to deltamethrin, thiachloprid, phosmet and CpGV-M shows that the CYP6B2 gene is responsible for cross-resistance between two synthetic molecules and that the major determinant of resistance to the virus is located in the 53,600,000 bp area on chromosome 1.The complexity of resistance mechanisms complicates their management in the field. The use of knowledge and techniques acquired in the study of resistance to synthetic insecticides is relevant and advisable to improve the sustainability of naturally occurring insecticides. The study of the genetic basis using genomic techniques confirms the existence of gene convergence, with resistance mechanisms often comparable between species, and opens up numerous research prospects., Certains insectes lorsqu’ils sont soumis à de fortes pressions insecticides développent la capacité à survivre à ces toxiques. Ce phénomène adaptatif appelé résistance aux insecticides est un exemple de microévolution. Grâce à l’étude de divers modèles biologiques j’ai abordé des questions concernant (i) les types de mécanismes de résistance et leur importance dans élaboration de stratégies de gestion sur le terrain ; (ii) l’anticipation et l’étude de résistances à des produits de biocontrôle pour augmenter leur durabilité; et (iii) les bases génétiques des résistances. Les études menées sur deux lépidoptères ravageurs : Grapholita molesta (Tortricidae) et Ostrinia nubilalis (Pyralidae) mettent en avant des mécanismes de résistances complexes et variables entre populations, basés sur des panels de combinaisons d’augmentation d’activité d’enzymes de détoxication et de mutation de la cible moléculaire de l’insecticide. Les recherches sur la préexistence de résistance à deux extraits naturels de plantes (l’acide 3,5-dicaféoyl quinique et l’acide dicafféoyl tartrique) avec des propriétés aphicides chez plusieurs espèces de pucerons ont montré (i) de faibles différences de sensibilités entre clones ou populations de Myzus persicae (Aphididae) possiblement en lien avec la taille des individus (ii) une insensibilité d’un clone d’Aphis craccivora (Aphididae). Aucune résistance croisée entre insecticides de synthèse et ces extraits naturels n’a été détectée. Les recherches sur le coût de la résistance de Cydia pomonella (Tortricidae) à l’isolat M de Cydia pomonella GranuloVirus (CpGV-M), un biopesticide largement utilisé, ont montré un faible coût limitant les possibilités de gestion de cette résistance. Enfin, l’étude génomique des bases génétiques des résistances de C. pomonella à la deltaméthrine, au thiaclopride, au phosmet et au CpGV-M montre que le gène CYP6B2 est responsable de résistances croisées entre deux molécules de synthèse et que le déterminant majeur de la résistance au virus est situé dans la zone des 53 600 000 pb sur le chromosome 1.La complexité des mécanismes de résistance complique leur gestion sur le terrain. L’utilisation des connaissances et des techniques acquises dans l’étude des résistances aux insecticides de synthèse est pertinente et souhaitable pour améliorer la durabilité des insecticides d’origine naturelle. L’étude des bases génétiques par des techniques de génomique confirme l’existence de convergences géniques, les mécanismes de résistance étant souvent comparables entre espèces et ouvre de nombreuses perspectives de recherche.
Published: 2021

47. Comprendre la diversité génétique de Toxoplasma gondii au Bénin au travers de ses hôtes et de son génome : des influences humaines et environnementales

Author: Hamidovic, Azra, Neuroépidémiologie Tropicale (NET), Institut Génomique, Environnement, Immunité, Santé, Thérapeutique (GEIST), Université de Limoges (UNILIM)-Université de Limoges (UNILIM)-CHU Limoges-Institut d'Epidémiologie Neurologique et de Neurologie Tropicale-Institut National de la Santé et de la Recherche Médicale (INSERM), Université de Limoges, Marie-Laure Dardé, Aurélien Mercier, CHU Limoges-Institut d'Epidémiologie Neurologique et de Neurologie Tropicale-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut Génomique, Environnement, Immunité, Santé, Thérapeutique (GEIST), and Université de Limoges (UNILIM)-Université de Limoges (UNILIM)
Subjects: Génomique, Epidemiology, Toxoplasma gondii, Génétique des Populations, Genomics, Epidémiologie, Population Genetics, [SDV.MHEP]Life Sciences [q-bio]/Human health and pathology
Abstract: Through international trades, Europe, Africa and South America share a long history of exchanges, potentially associated with exchanges of pathogens. We used Toxoplasma gondii, the worldwide parasite with a geographical structuration of its global population to study the influence of colonial trade on T. gondii genetic diversity in West-African countries. Previous data from Senegal showed a clear influence of Europe on the diversity on the coastal area. We therefore decided to study T. gondii genetic diversity in Benin, another West-African country with a more intense colonial history. By isolating T. gondii strains from domestic animals (from poultry, good bioindicators of the parasite presence in an environment) but also from DNA detected in rodents (preferred preys of felids) captured in Cotonou, we showed a predominance of the Africa 1 genotype by 15 microsatellites genotyping all over Benin, an autochtonous genotype highly virulent in certain rodent species. With population genetics analyses on these samples, we could imagine the recent evolutive history and how the actual parasite population structure and hosts were influenced in that part of Africa. However, the triangular trade continued to South America and especially Brazil where the Africa 1 genotype was also detected. The genome analyses of non-Africa 1 Brazilian strains suggested potential Africa 1 portions introgressions in their genome. That would be the result of the extensive exchanges during the slave trade and would have an impact today on the parasite virulence and in particular on human toxoplasmosis. The continuing work sould focus on studying the Beninese rodents immunology response against T. gondii, the study of T. gondii genomes with the idea to elucidate the past and recent evolutive histories of the parasite and how it is relate to human toxoplasmosis.; L’Europe, l’Afrique et l’Amérique du Sud partagent une longue histoire d’échanges commerciaux, qui ont potentiellement été associés à des échanges de pathogènes. Nous avons utilisé Toxoplasma gondii, parasite ubiquiste par excellence dont la diversité génétique semble être structurée géographiquement, pour étudier l’influence du commerce colonial sur cette diversité en Afrique de l’Ouest. Une précédente étude au Sénégal a montré une influence claire de l’Europe sur la diversité du toxoplasme sur la côte Ouest du pays. De ce fait, nous avons décidé d’étudier la diversité génétique de T. gondii au travers d’un autre pays de l’Afrique de l’Ouest ayant eu une histoire coloniale intense, le Bénin. Pour cela, nous avons isolé des souches de T. gondii à partir d’animaux domestiques (des volailles, bons bioindicateurs de la circulation de souches dans l’environnement) mais aussi de rongeurs, proies privilégiées des hôtes définitifs, les félidés. Le génotypage par microsatellites a montré une prédominance du génotype autochtone Africa 1 sur l’intégralité du territoire béninois, hautement virulent chez certains rongeurs. Grâce à des analyses de génétique des populations sur ces souches, nous avons pu en partie imaginer l’histoire évolutive du parasite et la manière dont celle-ci a influencé la structure des populations actuelles et de leurs hôtes dans cette partie de l’Afrique. Mais la traite négrière a continué jusqu’en Amérique du Sud et l’analyse de génomes Africa 1 et de souches brésiliennes semblent suggérer qu’il y ait eu des introgressions de portions Africa 1 dans le génome des souches brésiliennes. Ceci serait le résultat de la traite négrière et aurait aujourd’hui un impact sur la virulence de ces souches et notamment sur la clinique des toxoplasmoses humaines. Les suites de ces travaux devront se pencher sur le rôle de l’immunité des rongeurs béninois face à une infection toxoplasmique, l’étude de génomes de T. gondii dans l’idée d’élucider les histoires évolutives récentes et passées du parasite et de relier cela à la toxoplasmose humaine.
Published: 2020

48. Caractérisation d'axes drivers de l'oncogenèse des léiomyosarcomes : validations fonctionnelles et cibles thérapeutiques

Author: Darmusey, Lucie, Centre de Recherches en Cancérologie de Toulouse (CRCT), Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS), Université Paul Sabatier - Toulouse III, and Frédéric Chibon
Subjects: Génomique, Transcriptomique, Analyses fonctionnelles, Transcriptomic, Functional analysis, Oncogenèse, Leiomyosarcomas, Genomic, Léiomyosarcomes, [SDV.CAN]Life Sciences [q-bio]/Cancer, Oncogenesis
Abstract: Genomically complex sarcomas and more specifically leiomyosarcomas (LMS), which have a smooth muscle differentiation, are rare and aggressive tumors whose oncogenesis is still misunderstood. In order to comprehend this oncogenesis, an integration of multiple OMICS with clinical data of a cohort of 120 LMS was performed. This allowed to split LMSs into 2 groups clinically distinct: hLMS and oLMS. In this last group as well as in uterine LMS one of the most altered gene is ATRX. By studying the impacts of this alteration in mice models, I show that it leads to a higher growth rate and an escape to the immune system. In contrast to oLMSs, hLMSs have homogenous transcriptomes, they are more aggressive, are in the truck or the retroperitoneum, have histone marks of smooth muscles and express genes regulated by specific transcription factors of smooth muscle cell as SRF. Furthermore, hLMSs have specific alterations such as MYOCD overexpression, the co-factor of SRF into smooth muscle, and the loss of PTEN, able to restrict SRF fixation to its target genes of smooth muscle differentiation. Then, I could demonstrate that the inhibition of SRF/MYOCD interaction kills by apoptosis hLMS cells more than oLMS ones demonstrating that the activation of this axe is necessary to hLMS survival, making it an encouraging therapeutic target. To better understand how the pathological activation of this complex is leading the oncogenesis and how this cells become dependents of it, I developed a ChIPseq analysis to study, in the context of LMS, the targets of SRF/MYOCD fixation which analysis is ongoing. Together those works bring new therapeutic paths which preclinical studies must now continue in vivo.; Les sarcomes à génomique complexe et plus particulièrement les léiomyosarcomes (LMS), qui ont une différenciation musculaire lisse, sont des tumeurs rares et agressives dont l'oncogenèse reste aujourd'hui incomprise. Afin de mieux appréhender cette oncogenèse et de mettre en évidence ces drivers, une intégration de plusieurs OMICS et des données cliniques d'une cohorte de 120 LMS a été réalisée. Cela permet de séparer les LMS en deux grands groupes cliniquement différents : hLMS et oLMS. Dans ce dernier groupe ainsi que dans les LMS utérins, un des gènes les plus altérés est ATRX. Par l'étude de l'impact de cette altération dans des modèles murins, je montre qu'elle entraine une croissance plus rapide des tumeurs et un échappement au système immunitaire. A l'opposé des oLMS, les hLMS ont un transcriptome homogène, ils sont aussi plus agressifs, se situent au niveau du tronc et du rétropéritoine, ont des marques d'histones des muscles lisses et des gènes régulés par des facteurs de transcription spécifiques des muscles lisses comme SRF. De plus, les hLMS ont des altérations spécifiques notamment la surexpression de MYOCD, le cofacteur de SRF dans les muscles lisses, et la perte de PTEN, capable de limiter la fixation SRF à ses gènes cibles de la différenciation des muscles lisses. J'ai alors démontré que l'inhibition de l'interaction entre SRF et MYOCD entraine la mort par apoptose des cellules de hLMS plus fortement que celles de oLMS, démontrant ainsi que l'activation de cet axe est indispensable à la survie des hLMS, cela en fait une cible thérapeutique prometteuse. Pour mieux comprendre comment l'activation pathologique de ce complexe dirige l'oncogenèse et comment ces cellules en deviennent dépendantes, j'ai mis au point une analyse par ChIPseq pour étudier, dans le contexte des LMS, les cibles de la fixation du complexe SRF/MYOCD dont l'analyse est en cours. L'ensemble de ces travaux apporte de nouvelles voies thérapeutiques dont l'étude préclinique doit maintenant se poursuivre in-vivo.
Published: 2020

49. Diversité et activités de métabolites de cyanobactéries des boues thermales de Balaruc-les-Bains

Author: Demay, Justine, Molécules de Communication et Adaptation des Micro-organismes (MCAM), Muséum national d'Histoire naturelle (MNHN)-Centre National de la Recherche Scientifique (CNRS), Museum national d'histoire naturelle - MNHN PARIS, Thermes de Balaruc-les-Bains (Etablissement thermal), Cécile Bernard, Benjamin Marie, and Anita Reinhardt
Subjects: Cicatrisant, Anti-Inflammatoire, Boues thermales, Thermal mud, Wound healing, Metabolomic, Molecules, Cyanobacteria, Bioactivity, Antioxydant, Molécules, Anti-Inflammatory, Génomique, [SDV.MP]Life Sciences [q-bio]/Microbiology and Parasitology, Metabolites, Genomic, Métabolites, Antioxidant, Cyanobactéries, Bioactivité, Métabolomique
Abstract: Cyanobacteria are prokaryotic microorganisms capable of carrying out oxygen photosynthesis as a source of energy for their metabolism and capable of colonizing various ecosystems (e.g. seas, rivers, lakes, soil, extreme environments ...). They are also known to produce numerous bioactive molecules (toxins, antimicrobials, anti-inflammatory ...) with various structures. Thus, in recent years, cyanobacteria have been the subject of numerous research projects aimed at discovering and characterizing new natural products that can be used in the pharmaceutical, cosmetic, biotechnological and agri-food industries. In this context, the work carried out during this thesis focused on the diversity of bioactive molecules produced by cyanobacteria isolated from the thermal mud of Balaruc-les-Bains (France). Indeed, this work is part of an Industrial Convention for Training through Research (CIFRE) with the Balaruc-les-Bains Thermes, a historical thermal establishment specialized in rheumatology and phlebology. The main objectives of this work were to characterize the diversity of molecules produced by the nine cyanobacteria isolated from the thermal mud and to estimate the anti-inflammatory, antioxidant and healing properties of the raw extracts of these cyanobacteria. In order to answer this problem, a bibliographical review of the knowledge on the metabolites produced by the cyanobacteria and their referenced activities was carried out. Its analysis allowed to question the taxonomic origin of cyanobacteria producing metabolites as well as the chemical diversity and demonstrated bioactivity. In a second step, the global characterization of the nine cyanobacteria from thermal mud was carried out through the taxonomic affiliation of the strains studied and the global analysis of the genome and metabolome of each one using several high throughput methods of "omic" type. This work revealed the high diversity of metabolites produced by cyanobacteria, with more than 1400 metabolites described in the literature to date. They have also made it possible to characterize the incredible richness of microorganisms capable of developing within a specific environment such as thermal mud. Finally, a high potential for the production of bioactive molecules has been identified for the nine cyanobacteria of Balaruc-les-Bains. Four strains have shown promising results with regard to the activities detected: Planktothricoides raciborskii PMC 877.14, Nostoc sp. PMC 881.14 and Pseudo-chroococcus couteii PMC 885.14 for their anti-inflammatory potential and Aliinostoc sp. PMC 882.14 for its healing potential.Through these different approaches, this thesis work has highlighted the important therapeutic potential of cyanobacteria in the development of applications for thermal cures and opens the way to future projects to optimize the production of these bioactive molecules. In addition to the prospects for industrial applications, this work also opens up questions concerning the phenomena of regulation of the synthesis of these metabolites and the role of heterotrophic bacteria associated in culture with cyanobacteria.; Les cyanobactéries sont des microorganismes procaryotes capables de réaliser la photosynthèse oxygénique comme source d’énergie pour leur métabolisme et capable de coloniser divers écosystèmes (e.g. mers, rivières, lacs, sol, milieux extrêmes …). Elles sont également connues pour produire de nombreuses molécules bioactives (toxines, antimicrobiens, anti-inflammatoires, …) aux structures variées. Ainsi, ces dernières années, les cyanobactéries ont fait l’objet de nombreux projets de recherche visant à découvrir et caractériser de nouveaux produits naturels exploitables dans les domaines pharmaceutiques, cosmétiques, biotechnologiques et agroalimentaires. Dans ce contexte, les travaux menés au cours de cette thèse se sont intéressés à la diversité des molécules bioactives produites par les cyanobactéries isolées des boues thermales de Balaruc-les-Bains (France). En effet, ces travaux s’intègrent dans le cadre d’une Convention Industrielle de Formation par la Recherche (CIFRE) avec les Thermes de Balaruc-les-Bains, un établissement thermal historique spécialisé dans les soins de rhumatologie et de phlébologie. Les objectifs principaux de ces travaux ont donc été de caractériser la diversité de molécules produites par les neuf cyanobactéries isolées des boues thermales puis d’estimer les propriétés anti-inflammatoires, antioxydantes et cicatrisantes des extraits bruts de ces cyanobactéries. Afin de répondre à cette problématique, une revue bibliographique des connaissances sur les métabolites produits par les cyanobactéries et leurs activités référencées a été réalisée. Son analyse a permis de questionner l’origine taxonomique des cyanobactéries productrices de métabolites ainsi que la diversité chimique et de bioactivité démontrée. Dans un second temps, la caractérisation globale des neuf cyanobactéries issues des boues thermales a été réalisée à travers l’affiliation taxonomique des souches étudiées et l’analyse globale du génome et du métabolome de chacune à l’aide de plusieurs méthodes haut-débit de type « omique ». Ces travaux ont permis de se figurer la forte diversité de métabolites produits par les cyanobactéries avec plus de 1400 métabolites décrits à ce jour dans la littérature. Ils ont également permis de caractériser l’incroyable richesse de microorganismes capables de se développer au sein d’un environnement spécifique tel que les boues thermales. Enfin, un haut potentiel de production de molécules bioactives a pu être identifié pour les neuf cyanobactéries de Balaruc-les-Bains. Quatre souches ont d’ailleurs montré des résultats prometteurs au regard des activités détectées : Planktothricoides raciborskii PMC 877.14, Nostoc sp. PMC 881.14 et Pseudo-chroococcus couteii PMC 885.14 pour leur potentiel anti-inflammatoire et Aliinostoc sp. PMC 882.14 pour son potentiel cicatrisant. Par ces différentes approches, ces travaux de thèse ont permis de mettre en avant l’important potentiel thérapeutique des cyanobactéries dans le cadre du développement d’applications pour les cures thermales et ouvrent à de futurs projets d’optimisation de la production de ces molécules bioactives. Outre les perspectives de valorisation industrielle, ces travaux ouvrent également sur des questions autour des phénomènes de régulation de la synthèse de ces métabolites et sur le rôle des bactéries hétérotrophes associées en culture aux cyanobactéries.
Published: 2020

50. Orthologous and paralogous gene viewpoints on rodent genomics : phylogenomics and evolution of olfactory receptors

Author: Courcelle, Maxime, Institut des Sciences de l'Evolution de Montpellier (UMR ISEM), Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-École pratique des hautes études (EPHE), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Université de Montpellier (UM)-Institut de recherche pour le développement [IRD] : UR226-Centre National de la Recherche Scientifique (CNRS), Université Montpellier, Emmanuel Douzery, and Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-École Pratique des Hautes Études (EPHE)
Subjects: [SDV.SA]Life Sciences [q-bio]/Agricultural sciences, Génomique, Phylogénie, Récepteurs olfactifs, Rongeurs, Genomics, Olfactory receptors, Taxonomie, Rodents, Évolution moléculaire, Phylogeny, Molecular Evolution, Taxonomy
Abstract: Since its emergence in the 1980s, genomics has revolutionised many areas of the study of life. In particular, by providing vast data sets, it has enabled researchers to choose the molecular markers best suited to answer their biological question. During my thesis work, I studied the properties of two large groups of genes for comparative genomic analyses: orthologous genes (originating from a speciation event) and paralogous genes (sequences duplicated following a chromosomal event in a species). By constructing and analysing data sets at the rodent order scale, I have contributed to improving our knowledge of the relationships of rodents species related to mice, squirrels and chinchillas. In addition, I have applied myself to showing the impact of different molecular evolutionary characteristics of markers (e.g. evolutionary rates and nucleotide content) on phylogenetic reconstruction analyses. Finally, the study of the large family of olfactory receptor genes (about 1000 genes per species) has made it possible to demonstrate adaptations to the different lifestyles and diets found in these animals. In particular, burrowing species such as the different clades of mole rats (Bathyergidae and Spalacidae families) present a specific signature, found in a convergent manner in taxa that are phylogenetically distant.; Depuis son émergence dans les années 1980, la génomique a révolutionné de nombreux domaines de l'étude du vivant. En fournissant de vastes jeux de données, elle a notamment donné la possibilité aux chercheurs de choisir les marqueurs moléculaires les plus adaptés pour répondre à leur question biologique. Au cours de mes travaux de thèse, j’ai étudié les propriétés de deux grands groupes de gènes pour les analyses de génomique comparative : les gènes orthologues (descendant d’un évènement de spéciation) et les gènes paralogues (séquences dupliquées à la suite d’un évènement chromosomique chez une espèce). En construisant et analysant des jeux de données à l’échelle de l’ordre des rongeurs, j’ai contribué à améliorer notre connaissance des liens de parenté entre les différents groupes d’espèces apparentées aux souris, aux écureuils et aux chinchillas. De plus, je me suis appliqué à montrer l’impact des différentes caractéristiques d’évolution moléculaire des marqueurs (vitesses d’évolution et contenu en nucléotides par exemple) sur les analyses de reconstruction phylogénétique. Enfin, l’étude de la grande famille de gènes des récepteurs olfactifs (environ 1000 gènes par espèce) a permis de démontrer des adaptations aux différents styles de vie et régimes alimentaires trouvés chez ces animaux. En particulier, les espèces fouisseuses comme les différents clades de rats- taupes appartenant aux familles Bathyeridae et Spalacidae présentent une signature spécifique, retrouvée de manière convergente chez des taxons pourtant éloignés phylogénétiquement.
Published: 2020

Catalog

Books, media, physical & digital resources

See catalog results

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Search

Search Constraints

Refine your results

Search Limiters

Topic

Publication Year Range

Language

Publication Type

Journal

Database

Publisher

538 results on '"Génomique"'

Search Results

Catalog

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources