98 results on '"Genòmica comparativa"'
Search Results
2. PRESENT AND PROSPECTS OF RESEARCH ON NEOTROPICAL MAMMALS USING GENOMIC APPROACHES.
- Author
-
Nery, Mariana F., Ramos, Elisa K. S., Souza, Érica M. S., and Ribeiro, Pedro G.
- Subjects
- *
MAMMALS , *GENOMES - Abstract
The recent revolution in sequencing methods allowed the generation of genomic, transcriptomic, and other large-scale data at a speed and low cost undreamed fifteen years ago. These large datasets can be used for understanding complex processes and are already a reality for many taxonomic groups in the world. The transition of several biological fields such as ecology, systematics, developmental biology and biological conservation into the genomic era promises to foster our understanding of functional and structural mammalian biodiversity in Neotropics, as new sequencing technologies liberate virtually any species from genomic ignorance and transform them into new study models. Here, we aim to first give a brief overview on recent development of genomic technologies and then illustrate how these technologies are being used to study Neotropical mammals in several fields. Finally, we discuss caveats and future perspectives, as the number of genomic sequences available is continually increasing and opening new avenues for research. Although progressing in a slower pace when compared to other mammals of the world, genomics has already provided important insights and promises to deliver many more. Considering the great importance of Neotropical realm and all the threats that biodiversity must face on this biogeographical area, the future of the diversity of mammals here depends largely on urgent conservation actions based on scientific knowledge, making genomics as useful as never before. [ABSTRACT FROM AUTHOR]
- Published
- 2020
- Full Text
- View/download PDF
3. Comparative genomic analysis of Trypanosoma cruzi and trypanosomes of the Trypanosoma rangeli - Trypanosoma conorhini clade by molecular karyotyping and comparative genomic hybridization (aCGH)
- Author
-
Carmo, Rafaela Andrade do [UNIFESP] and Silveira Filho, José Franco [UNIFESP]
- Subjects
Cariotipagem molecular ,Trypanosoma conorhini ,Genomica comparativa ,Clado Trypanosoma cruzi ,Trypanosoma rangeli - Abstract
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) As espécies do clado Trypanosoma cruzi (Trypanosoma rangeli, Trypanosoma conorhini e T. cruzi) compartilham vetores e regiões geográficas. T. cruzi é o agente etiologico da doença de Chagas enquanto T. rangeli é avirulento em humanos. T. conorhini não infecta humanos e é filogeneticamente mais próximo de T. rangeli do que em relação a T. cruzi. A comparação genômica entre estas espécies é importante para compreendermos a evolução da virulência e patogenicidade de tripanossomas em humanos. Análise filogenética com marcadores moleculares identificaram padrões de ancestralidade comuns entre as espécies do clado T. cruzi. Nesta tese, nós comparamos o cariótipo molecular e os genomas de T. rangeli, T. cruzi e T. conorhini por hibridização das bandas cromossômicas separadas por eletroforese de campo pulsado com marcadores cromossomo-específicos, análise sintenica por bioinformática usando sequencias genômicas e hibridização genômica comparativa (aCGH). Estabelecemos o cariótipo de isolados de T. rangeli e T. conorhini provenientes de diferentes hospedeiros (triatomíneos e mamíferos) e regiões geográficas (Américas Central e do Sul). O cariótipo padrão de T. rangeli é composto por 15-21 bandas cromossômicas distribuídas em 2-5 megabandas (2,07-3,36 Mb) e 14-15 bandas de menor tamanho (0,40- 1,70 Mb). A única exceção foi o isolado humano H14 de T. rangeli da América Central que apresentou perfil cariotípico bastante complexo. O cariótipo de T. conorhini é semelhante ao de T. rangeli. A integração dos dados de sequenciamento genômico com os de hibridização das bandas cromossômicas com marcadores cromossomo-específicos mostrou que os blocos sintênicos (TcChr39) e (TcChr37+TcChr4) de T. cruzi também estão conservados com razoável manutenção da ordem gênica em T. rangeli e T. conorhini. Nestas espécies, os grupos sintênicos foram fragmentados, cada um deles, em 2 grupos de ligação menores, intercalados por regiões assintenicas. T. rangeli e T. conorhini diferem de T. cruzi com relação ao número, tamanho e conteúdo gênico de seus cromossomos resultante de diferentes combinações entre blocos sintênicos comuns entre estas espécies. Alterações do número cromossômico podem ter sido geradas por fissão cromossômica, como por exemplo, a separação do bloco sintênico (TcChr4+TcChr37) resultando em T. rangeli em uma banda menor (0,72 Mb) contendo o grupo de ligação TChr4. Também sugerimos que a combinação dos blocos sintênicos de TcChr39 e TChr37 poderia ter gerado um único cromossomo mapeado na banda cromossômica de 2,33 Mb de T. rangeli. A comparação por Hibridização Genômica Comparativa (aCGH) entre T. cruzi CLB e T. rangeli SC58 confirmou a variabilidade genética entre isolados de T. rangeli, notadamente, nos isolados de humanos da América Central. Na comparação dos genomas T. rangeli com T. cruzi foram identificadas alterações de ganho e de perda de material genético. Algumas alterações de ganho ocupam quase toda extensão do cromossomo, sugerindo a ocorrência de aneuploidia cromossômica. Existem eventos de ganho comuns aos isolados de T. rangeli e T. conorhini. As famílias multigênicas estão presentes na maioria alterações de ganho presentes nos genomas de T. rangeli e T. conorhini. Também foram identificadas alterações relacionadas com genes de proteínas hipotéticas e outros genes. Em resumo, T. cruzi e a as espécies do clado T. rangeli-T. conorhini compartilham blocos sintênicos que estão reunidos em diferentes combinações nestas espécies. 147453/2016-0
- Published
- 2022
4. From populations to species : Unravelling the unknowns of ageing with two complementary approaches
- Author
-
Farré Ramon, Xavier, Navarro i Cuartiellas, Arcadi, 1969, Muntané Medina, Gerard, and Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut.
- Subjects
Pleiotropy ,Ageing ,Genòmica comparativa ,Evolution ,Envelliment ,Comparative genomics ,Genetics ,Pleiotropia ,Evolució ,Genètica - Abstract
Ageing is a very complex phenotype that has been widely studied, but is still largely unknown. Most of the studies focus on a single species, or on performing genome wide association studies in human cohorts, but this only provides a glimpse into the genetics that shaped the lifespan of a species, since some variants are fixed or segregate at very low frequency in a given species, and thus cannot be detected by these methods. Instead, we studied ageing from an evolutionary perspective; first, by using comparative genomics, taking advantage of its phenotypic diversity in mammals to gain insight into which genes and pathways have contributed to its diversity; and second, by studying the shared genetic architecture -pleiotropy- between early and late onset diseases and, as a detailed case study, between longevity and two early onset diseases with a relatively high prevalence, schizophrenia and bipolar disorder, to discover new loci influencing human longevity and to test evolutionary theories of ageing. L'envelliment és un fenotip molt complex i àmpliament estudiat, però encara està ple d'incògnites. La major part dels estudis se centren en una única espècie, o en realitzar estudis d'associació del genoma complet en cohorts humanes, però això només ofereix un cop d'ull a la genètica que ha contribuït a establir la longevitat d'una determinada espècie, ja que algunes variants hi estan fixades, o apareixen en molt baixa freqüència, impedint la seva detecció amb aquests mètodes. En canvi, nosaltres vam estudiar l'envelliment des de la perspectiva de l'evolució; primer, mitjançant la genòmica comparativa, aprofitant la seva diversitat fenotípica en mamífers per comprendre millor quins gens i rutes hi han contribuït; i segon, estudiant la pleiotropia entre malalties d'aparició precoç o tardana i, com a estudi detallat, entre la longevitat i dues malalties d'aparició precoç amb prevalença relativament alta, esquizofrènia i trastorn bipolar, per a descobrir nous loci que afecten la longevitat humana i per a avaluar les teories evolutives de l'envelliment.
- Published
- 2022
5. Evidence for shared genetic risk factors between lymphangioleiomyomatosis and pulmonary function
- Author
-
Mireia Tena-Garitaonaindia, Berta Sáez, Wonji Kim, Álvaro Casanova, Coline H.M. van Moorsel, José Antonio Rodríguez-Portal, Rosalía Laporta, Eline Blommaert, Krinio Giannikou, Julio Ancochea, Antonio Roman, Fermín Sánchez de Medina, Miquel Angel Pujana, Rafael de Cid, Maria Molina-Molina, Carmen Herranz, Piedad Ussetti, Claudia Valenzuela, Francesca Mateo, Roderic Espín, Alexandra Baiges, Marian J.R. Quanjel, Xavier Farré, David J. Kwiatkowski, Sungho Won, Joanne J. van der Vis, Institut Català de la Salut, [Farré X] Genomes for Life – GCAT Lab Group, Institut Germans Trias i Pujol, Badalona, Spain. [Espín R, Baiges A, Blommaert E] ProCURE, Catalan Institute of Oncology, Oncobell, Bellvitge Institute for Biomedical Research (IDIBELL), Barcelona, Spain. [Kim W] Channing Division of Network Medicine, Dept of Medicine, Brigham and Women’s Hospital, Harvard Medical School, Boston, MA, USA. [Giannikou K] Cancer Genetics Laboratory, Division of Pulmonary and Critical Care Medicine, Brigham and Women’s Hospital and Harvard Medical School, Boston, MA, USA. [Román A, Sáez B] Unitat de Trasplantament Pulmonar, Servei de Pneumologia, Vall d’Hebron Hospital Universitari, Barcelona, Spain. Vall d’Hebron Institut de Recerca (VHIR), Barcelona, Spain, Vall d'Hebron Barcelona Hospital Campus, Asociación Española de Linfangioleiomiomatosis, LAM Foundation, Instituto de Salud Carlos III, European Commission, Ministerio de Ciencia, Innovación y Universidades (España), Agencia Estatal de Investigación (España), Generalitat de Catalunya, and Institut Germans Trias i Pujol
- Subjects
Pulmonary and Respiratory Medicine ,Investigative Techniques::Epidemiologic Methods::Epidemiologic Research Design::Genome-Wide Association Study [ANALYTICAL, DIAGNOSTIC AND THERAPEUTIC TECHNIQUES, AND EQUIPMENT] ,Bioinformatics ,Interstitial Lung Disease ,Pulmonary function testing ,Interstitial and orphan lung disease ,Lung structure and function ,Genòmica comparativa ,immune system diseases ,hemic and lymphatic diseases ,medicine ,Genetics ,Original Research Article ,Genetic risk ,neoplasias::neoplasias por tipo histológico::tumores de los vasos linfáticos::linfangiomioma::linfangioleiomiomatosis [ENFERMEDADES] ,business.industry ,bacterial infections and mycoses ,medicine.disease ,Pulmons - Malalties ,Respiratory Tract Diseases::Lung Diseases [DISEASES] ,Lymphangioleiomyomatosis ,técnicas de investigación::métodos epidemiológicos::diseño de la investigación epidemiológica::estudio de asociación genómica completa [TÉCNICAS Y EQUIPOS ANALÍTICOS, DIAGNÓSTICOS Y TERAPÉUTICOS] ,lipids (amino acids, peptides, and proteins) ,Neoplasms::Neoplasms by Histologic Type::Lymphatic Vessel Tumors::Lymphangiomyoma::Lymphangioleiomyomatosis [DISEASES] ,enfermedades respiratorias::enfermedades pulmonares [ENFERMEDADES] ,business - Abstract
This research was supported by Asociacion Espanola de LAM; The LAM Foundation Seed Grant 2019; Carlos III Institute of Health grants PI18/01029, PI21/01306 and ICI19/00047 (co-funded by European Regional Development Fund (ERDF), "A way to build Europe"); Ministry of Economy and Competitivity grant SAF2017-88457-R; the Generalitat de Catalunya SGR 2017-449 and 2017-529; PERIS PFI-Salut SLT017-20-000076; and the CERCA Program to IDIBELL and Institut Germans Trias i Pujol. X. Farre is supported by the VEIS project (001-P-001647, ERDF Operational Programme of Catalonia 2014-2020; co-funded by ERDF, "A way to build Europe"). Funding information for this article has been deposited with the Crossref Funder Registry., Introduction Lymphangioleiomyomatosis (LAM) is a rare low-grade metastasising disease characterised by cystic lung destruction. The genetic basis of LAM remains incompletely determined, and the disease cell-of-origin is uncertain. We analysed the possibility of a shared genetic basis between LAM and cancer, and LAM and pulmonary function. Methods The results of genome-wide association studies of LAM, 17 cancer types and spirometry measures (forced expiratory volume in 1 s (FEV1), forced vital capacity (FVC), FEV1/FVC ratio and peak expiratory flow (PEF)) were analysed for genetic correlations, shared genetic variants and causality. Genomic and transcriptomic data were examined, and immunodetection assays were performed to evaluate pleiotropic genes. Results There were no significant overall genetic correlations between LAM and cancer, but LAM correlated negatively with FVC and PEF, and a trend in the same direction was observed for FEV1. 22 shared genetic variants were uncovered between LAM and pulmonary function, while seven shared variants were identified between LAM and cancer. The LAM-pulmonary function shared genetics identified four pleiotropic genes previously recognised in LAM single-cell transcriptomes: ADAM12, BNC2, NR2F2 and SP5. We had previously associated NR2F2 variants with LAM, and we identified its functional partner NR3C1 as another pleotropic factor. NR3C1 expression was confirmed in LAM lung lesions. Another candidate pleiotropic factor, CNTN2, was found more abundant in plasma of LAM patients than that of healthy women. Conclusions This study suggests the existence of a common genetic aetiology between LAM and pulmonary function., Asociacion Espanola de LAM, LAM Foundation Seed Grant 2019, Instituto de Salud Carlos III PI18/01029 PI21/01306 ICI19/00047, European Regional Development Fund (ERDF), "A way to build Europe", Ministry of Economy and Competitivity SAF2017-88457-R, Generalitat de Catalunya, General Electric SGR 2017-449 2017-529, PERIS PFI-Salut SLT017-20-000076, CERCA Program, VEIS project 001-P-001647, ERDF, "A way to build Europe" ERDF Operational Programme of Catalonia 2014-2020
- Published
- 2022
6. Aplicación del análisis de rango reescalado R/S para la predicción de genes en el genoma vegetal
- Author
-
Martha Isabel Almanza Pinzón, Karina López López, and Carlos Eduardo Téllez Villa
- Subjects
Genómica comparativa ,predicción de genes ,análisis R/S ,coeficiente de Hurst ,Arabidopsis thaliana ,Oryza sativa ,Mus musculus. ,Agriculture - Abstract
La predicción de genes es en la actualidad uno de los principales desafíos de la genómica. La predicción permite realizar experimentos con alta probabilidad de encontrar genes de interés y comparar regiones de ADN de importancia agronómica entre genomas; además, ayuda a restringir los espacios de búsqueda en las bases de datos. Un procedimiento estadístico con base en el análisis R/S y el coeficiente de Hurst fue desarrollado para caracterizar y predecir genes y los componentes estructurales de estos (exones e intrones) en los genomas eucariotas completos de Arabidopsis thaliana, Oriza sativa y Mus musculus. Algoritmos en lenguaje de programación Python fueron desarrollados para extraer, filtrar y modelar más del 80% de las secuencias de genes registradas para estos genomas en la base de datos del GeneBank del NCBI. El análisis R/S permitió demostrar que existe un orden estructural en la distribución de los nucleótidos que constituyen las secuencias en las que predominan los fenómenos de memoria o dependencia de largo alcance. La estructura de memoria varía según el tipo de secuencias y el genoma de la especie. Las secuencias de los genes y exones de los genomas vegetales analizados presentaron comportamiento persistente mientras que las de los intrones tuvieron un comportamiento antipersistente, en comparación, al genoma animal en el cual los tres tipos de secuencias presentaron comportamiento persistente. De acuerdo con los parámetros provenientes del análisis R/S, el patrón de distribución de las secuencias del genoma se repitió de manera estadísticamente similar en cada uno de los cromosomas que pertenecen a una especie, constituyéndose en evidencias fundamentales de invarianza por cambio de escala; es decir, cada cromosoma por sí solo es una réplica estadística a menor escala del genoma completo. Los parámetros constituyeron criterios compactos para derivar predictores (clasificadores) de secuencias que alcanzaron promedios de sensibilidad y especificidad mayor del 81% y 70%, respectivamente. Este procedimiento podría ser probado en otros genomas y utilizado como criterio para incrementar la eficiencia de la selección en los programas de mejoramiento genético vegetal.
- Published
- 2010
7. Estudio de redes de regulación transcripcional mediante maximización de la expectación
- Author
-
Serra-Sagristà, Joan, Holgado Chicharro, Daniel, Universitat Autònoma de Barcelona. Escola d'Enginyeria, Serra-Sagristà, Joan, Holgado Chicharro, Daniel, and Universitat Autònoma de Barcelona. Escola d'Enginyeria
- Abstract
Descripción, desarrollo e implementación de nuevas funcionalidades para CGB. CGB es un software que se basa en el uso de métodos de genómica comparativa para analizar redes de regulación transcripcional. Las nuevas funciones introducidas son la implementación de la obtención automática de genomas para el input de CGB y introducción de algoritmos de alineamientos de secuencias para los motivos de referencia., Description, development and implementation of new functionalities for CGB. CGB is a software that is based on the use of comparative genomics methods to analyse transcriptional regulatory networks. The new functions introduced are the implementation of automatic genome retrieval for CGB input and introduction of sequence alignment algorithms for reference motifs., Descripció, desenvolupament i implementació de noves funcionalitats per a CGB. CGB és un programari basat en l'ús de mètodes de genòmica comparativa per analitzar xarxes de regulació transcripcional. Les noves funcions introduïdes són la implementació de l'obtenció automàtica de genomes per a l'input de CGB i la introducció d'algorismes d'alineaments de seqüències per als motius de referència.
- Published
- 2021
8. Use of the Jaccard Index to analyze the short-term evolution of bacterial genomes
- Author
-
Cruz, Fernando de la, Cruz, Fernando de la [0000-0003-4758-6857], Ghadban Garrido, Cristina, Cruz, Fernando de la, Cruz, Fernando de la [0000-0003-4758-6857], and Ghadban Garrido, Cristina
- Abstract
[EN] Bacterial genomes have evolved over millions of generations to become one of the most efficient and compact on the planet. Genome evolution is the result of a combination of point mutations, horizontal gene transfer, deletions, duplications and gene rearrangements. Advances in sequencing technologies have provided unprecedented access to the enormous genetic diversity that has been accumulated in the bacterial domain during its 3.500-4.000 million years of evolution. Faced with this wealth of information, microbiologists must develop structured means for describing this diversity to enable them to relate phenotype and genotype, thus facilitating a better understanding of the microbiological world. With this purpose, the objective of this TFM has been to develop a technique capable of detecting mutations between very similar genomes (with Jaccard index (JI) greater than 0.99), allowing us to establish which evolutionary events have taken place between one sample and another. For this purpose, a Python code has been developed that calculates the filtered Jaccard index, a modification of the JI that filters out those sequences that only differ in one character. Applied to genomics, the filtered Jaccard index estimates the similarity between very similar genomes by excluding in the calculation of the coefficient those k-mers (sequences of k length) derived from the presence of single nucleotide polymorphism (SNPs), that is, changes of a single nucleotide (equivalent to a single character). As a result, we have obtained an efficient tool for filtering k-mers related to SNPs that allows the calculation of the Jaccard index taking into account only those mutations that involve differences greater than one base. In this way, the understanding of the genetic differences between genomes of the same species is facilitated, which simplifies and speeds up the monitoring of the prevalence of bacterial strains as well as any changes in the patterns of antibiotic resistance an, [ES] Los genomas bacterianos han evolucionado a lo largo de millones de generaciones hasta convertirse en unos de los más eficientes y compactos del planeta. La evolución del genoma es el resultado de la combinación de mutaciones puntuales, transferencia horizontal de genes, deleciones, duplicaciones y reordenamientos génicos. Los avances en las tecnologías de secuenciación han proporcionado un acceso sin precedentes a la enorme diversidad genética que se ha acumulado en el ámbito bacteriano durante sus 3.500-4.000 millones de años de evolución. Ante esta gran cantidad de información, los microbiólogos deben desarrollar medios estructurados para describir esta diversidad que les permita relacionar fenotipo y genotipo, facilitando así una mejor comprensión del mundo microbiológico. Con este propósito, el objetivo de este trabajo final de máster ha sido el desarrollo de una técnica capaz de detectar las mutaciones entre genomas muy similares (con índices de Jaccard (JI) superiores al 0.99) permitiendo establecer qué eventos evolutivos se han sucedido entre una muestra y otra. Para ello, se ha desarrollado un código en Python que calcula el índice de Jaccard filtrado, una modificación del JI que filtra aquellas secuencias que sólo se distinguen en un caracter. Aplicado a genómica, el índice de Jaccard filtrado estima la similitud entre genomas muy similares omitiendo en el cómputo del coeficiente aquellos k-mers (secuencias de k longitud) derivados de la aparición de single nucleotide polymorphism (SNPs), es decir, cambios de un solo nucleótido (equivalente a un único caracter). Como resultado, se ha obtenido una herramienta eficaz en el filtrado de k-mers relativos a SNPs que permite el cálculo del índice de Jaccard teniendo en cuenta sólo aquellas mutaciones que implican diferencias mayores a una base. De esta forma, se facilita el entendimiento de las diferencias genéticas entre genomas de la misma especie, lo que permite simplificar y agilizar la monitorización de
- Published
- 2021
9. Comparación entre genomas de múltiples subtipos de Blastocystis aislados en Colombia.
- Author
-
Higuera, Adriana, Salas-Leiva, Dayana E., Curtis, Bruce, Patiño, Luz H., Dandan Zhao, Jerlström-Hultqvist, Jon, Dutlek, Marlena, Muñoz, Marina, Roger, Andrew J., and Ramírez, Juan D.
- Abstract
Copyright of Biomédica: Revista del Instituto Nacional de Salud is the property of Instituto Nacional de Salud of Colombia and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2022
10. História evolutiva da superfamília de proteínas indutoras de necrose e etileno nos Dothideomycetes (Ascomycota)
- Author
-
Dal’Sasso, Thaís Carolina da Silva and Oliveira, Luiz Orlando de
- Subjects
Genômica comparativa ,Filogenia ,Evolução ,Fungos fitopatogênicos ,Fitossanidade ,Genômica ,Corynespora cassiicola - Abstract
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior Conselho Nacional de Desenvolvimento Científico e Tecnológico Proteínas indutoras de necrose e etileno (NLPs) formam uma superfamília amplamente distribuída e estão envolvidas nas fases iniciais da infecção de plantas, podendo desencadear respostas imunes do hospedeiro. A maioria das NLPs possui atividade citotóxica que induz a morte celular em eudicotiledôneas. Dothideomycetes constituem uma grande e diversa classe dentro do filo Ascomycota. Corynespora cassiicola (Pleosporales) é um fitopatógeno polífago, que causa doenças em diversas culturas. Nós utilizamos abordagens de genômica comparativa e análises de filogenia molecular para investigar a história evolutiva das NLPs nos Dothideomycetes e em C. cassiicola. Inicialmente, descrevemos dois genomas: C. cassiicola CC_29 e C. olivacea CBS 114450. Nós mostramos que anotações para os dois genomas diferiram e nossa filogenômica indicou que Corynespora não é um gênero monofilético e sugerimos que a classificação de C. olivacea neste gênero seja revisada. Nós investigamos a evolução das NLPs entre os Dothideomycetes. Nós acessamos os recursos genômicos de 33 espécies (cinco ordens) com diferentes estilos de vida. As filogenias desbalanceadas das NLPs sugeriram caminhos evolutivos independentes para suas subfamílias dentro dos Dothideomycetes, cada uma com diferentes assinaturas de antigas duplicações gênicas e sucessivas perdas tendenciosas de genes que podem estar associadas à atividade citotóxica. Posteriormente, acessamos os recursos genômicos de 44 isolados de C. cassiicola e os perfis de expressão gênica dos genes NLP de C. cassiicola CC_29 nas primeiras horas de colonização do hospedeiro. Três genes que codificam efetores NLP foram mantidos em C. cassiicola e evoluíram sob diferentes restrições seletivas. Apesar de altamente divergentes, os efetores NLP de C. cassiicola mantiveram conservados os resíduos necessários para desencadear as respostas imunes das plantas. No entanto, os perfis de expressão gênica indicaram que apenas um gene efetor NLP é altamente expresso nas primeiras horas de colonização de soja por C. cassiicola CC_29. Palavras-chave: Efetores. Evolução. Filogenômica. Genômica comparativa. Corynespora cassiicola. Necrosis- and Ethylene-inducing peptide 1-like proteins (NLPs) form a broadly distributed superfamily involded in the early phases of plant infection and may trigger host immune responses. The majority of NLPs acts as cytotoxic proteins, inducing cell- death in eudicot plants. Dothideomycetes is a large and diverse class within the phylum Ascomycota. Corynespora cassiicola (Pleosporales) is a widespread, polyphagous plant-pathogen that causes leaf diseases on many crops. We used comparative genomic approaches and molecular phylogenetic analyses to investigate the evolutionary history of NLP across the Dothideomycetes and within C. cassiicola. Initially, we described two genomes: C. cassiicola CC_29 and C. olivacea CBS 114450. We showed that the two genome annotations differed greatly. A robust phylogenomics indicated the non-monophyly for the genus Corynespora and we suggested that the classification of C. olivacea into that genus should be revised. Subsequently, we investigate the evolution of NLPs across the Dothideomycetes. We accessed genomic resources from 33 species (five orders) with different lifestyles. The imbalanced phylogenies of NLPs suggested NLP subfamilies underwent independent evolutionary paths in the Dothideomycetes, each of which showing different signatures of ancient gene duplications and biased successive gene losses that may be associated with changes in cytotoxic activity. Subsequently, we accessed genomic resources from 44 isolates of C. cassiicola and the expression profiles of NLP- encoding genes of C. cassiicola CC_29 at the early hours of host colonization. Three NLP effector-encoding genes were maintained in the genomes of C. cassiicola and have evolved under different selective constraints. Despite highly divergent, NLP effectors maintained conserved the residues necessary to trigger plant immune responses. Nevertheless, gene expression profiles suggested that only one NLP effector gene is highly expressed at the early hours of soybean colonization by C. cassiicola. Keywords: Effector. Evolution. Phylogenomics. Comparative genomics. Corynespora cassiicola.
- Published
- 2021
11. Use of the Jaccard Index to analyze the short-term evolution of bacterial genomes
- Author
-
Ghadban Garrido, Cristina, Cruz, Fernando de la, and Cruz, Fernando de la [0000-0003-4758-6857]
- Subjects
índice de Jaccard ,Salmonella ,Comparative genomics ,k-mer ,Jaccard index ,genómica comparativa ,SNPs - Abstract
Trabajo fin de Máster defendido en la Facultad de Ciencias de la Universidad de Cantabria, el 25 de junio de 2021 - Curso 2020-2021 - Máster Interuniversitario en Ciencia de Datos / Master in Data Science (UIMP-UC-CSIC), [EN] Bacterial genomes have evolved over millions of generations to become one of the most efficient and compact on the planet. Genome evolution is the result of a combination of point mutations, horizontal gene transfer, deletions, duplications and gene rearrangements. Advances in sequencing technologies have provided unprecedented access to the enormous genetic diversity that has been accumulated in the bacterial domain during its 3.500-4.000 million years of evolution. Faced with this wealth of information, microbiologists must develop structured means for describing this diversity to enable them to relate phenotype and genotype, thus facilitating a better understanding of the microbiological world. With this purpose, the objective of this TFM has been to develop a technique capable of detecting mutations between very similar genomes (with Jaccard index (JI) greater than 0.99), allowing us to establish which evolutionary events have taken place between one sample and another. For this purpose, a Python code has been developed that calculates the filtered Jaccard index, a modification of the JI that filters out those sequences that only differ in one character. Applied to genomics, the filtered Jaccard index estimates the similarity between very similar genomes by excluding in the calculation of the coefficient those k-mers (sequences of k length) derived from the presence of single nucleotide polymorphism (SNPs), that is, changes of a single nucleotide (equivalent to a single character). As a result, we have obtained an efficient tool for filtering k-mers related to SNPs that allows the calculation of the Jaccard index taking into account only those mutations that involve differences greater than one base. In this way, the understanding of the genetic differences between genomes of the same species is facilitated, which simplifies and speeds up the monitoring of the prevalence of bacterial strains as well as any changes in the patterns of antibiotic resistance and virulence, especially those that cause zoonoses, among which the example of this work stands out: Salmonella spp., [ES] Los genomas bacterianos han evolucionado a lo largo de millones de generaciones hasta convertirse en unos de los más eficientes y compactos del planeta. La evolución del genoma es el resultado de la combinación de mutaciones puntuales, transferencia horizontal de genes, deleciones, duplicaciones y reordenamientos génicos. Los avances en las tecnologías de secuenciación han proporcionado un acceso sin precedentes a la enorme diversidad genética que se ha acumulado en el ámbito bacteriano durante sus 3.500-4.000 millones de años de evolución. Ante esta gran cantidad de información, los microbiólogos deben desarrollar medios estructurados para describir esta diversidad que les permita relacionar fenotipo y genotipo, facilitando así una mejor comprensión del mundo microbiológico. Con este propósito, el objetivo de este trabajo final de máster ha sido el desarrollo de una técnica capaz de detectar las mutaciones entre genomas muy similares (con índices de Jaccard (JI) superiores al 0.99) permitiendo establecer qué eventos evolutivos se han sucedido entre una muestra y otra. Para ello, se ha desarrollado un código en Python que calcula el índice de Jaccard filtrado, una modificación del JI que filtra aquellas secuencias que sólo se distinguen en un caracter. Aplicado a genómica, el índice de Jaccard filtrado estima la similitud entre genomas muy similares omitiendo en el cómputo del coeficiente aquellos k-mers (secuencias de k longitud) derivados de la aparición de single nucleotide polymorphism (SNPs), es decir, cambios de un solo nucleótido (equivalente a un único caracter). Como resultado, se ha obtenido una herramienta eficaz en el filtrado de k-mers relativos a SNPs que permite el cálculo del índice de Jaccard teniendo en cuenta sólo aquellas mutaciones que implican diferencias mayores a una base. De esta forma, se facilita el entendimiento de las diferencias genéticas entre genomas de la misma especie, lo que permite simplificar y agilizar la monitorización de la prevalencia de las cepas bacterianas así como cualquier cambio en los patrones de resistencia a los antibióticos y virulencia, en especial aquellas que provocan zoonosis, entre las que destaca el ejemplo de este trabajo: Salmonella spp.
- Published
- 2021
12. Análisis genómico de las funciones proteicas y relaciones taxonómicas de bacterias causantes de enfermedad diarreica aguda.
- Author
-
Moya-Salazar, Jeel Jr. and Ubidia-Incio, Roberto A.
- Abstract
An analytical-correlational cross section study was designed to analyze the genomes of acute diarrheal disease (ADD) causing bacteria and functional relations were established between protein functions based on the analysis performed by COGs database and TaxPlot tools. We counted the percentages of COGs for every category for each species, and determined the percentages based on the total number of COGs for each species. We made an interproteic comparative analysis for each species using TaxPlot and a phylogenetic classification for the proteins codified in complete genomes using the UPGMA algorithm. A total of 15 microorganisms were included (9 AAD-causing bacteria and 6 saprophytic bacteria). Eleven of these 15 bacteria had higher COGs in the categories J -12.25%- (6 ADD-causing bacteria and 5 saprophytic bacteria). The metabolic functional categories were uniform, and the functional categories Y (0.00%), Z (0.03%), B (0.01%) and A (0.05%) had the smallest quantities. COGs can be extrapolated into exact data that describe the protein profile of these pathogenic agents. The TaxPlot phylogenetic method reduces analysis time and represents an holistic approximation for the study of the phylogenetic relations at a proteomic level. [ABSTRACT FROM AUTHOR]
- Published
- 2015
13. Effector repertoire of Phytophthora betacei : in search of possible virulence factors responsible for its host specificity
- Author
-
Rojas Estevez, Cindy Paola
- Subjects
Oomicetes ,Phytophthora ,Relaciones planta-microbio ,Parásitos en las plantas ,Patología vegetal ,Biología ,Genómica comparativa ,Biología computacional ,Plantas parásitas - Abstract
Phytophthora betacei is an oomycete plant pathogen closely related to Phytophthora infestans. It infects tree tomato (Solanum betaceum) in northern South America, but is, under natural conditions, unable to infect potatoes or tomatoes, the main hosts of its sister species P. infestans. We characterized, and compared the effector repertoires of P. betacei and other Phytophthora species. To this end, we used in silico approaches to predict and describe the repertoire of secreted proteins in Phytophthora species and determine unique and core effectors. P. betacei has the largest proteome and secretome of all Phytophthora species evaluated. We identified between 450 and 1933 candidate effector genes in P. ramorum, P. sojae, P. cactorum, P. parasitica, P. palmivora, P. infestans, and P. betacei genomes. The P. betacei predicted secretome contains 5653 proteins, 1126 of which are apoplastic effectors and 807cytoplasmic effectors. Phytophthora betacei es un patógeno vegetal oomiceto estrechamente relacionado con Phytophthora infestans. Infecta el tomate de árbol (Solanum betaceum) en el norte de Sudamérica, pero, en condiciones naturales, no puede infectar patatas o tomates, los principales hospedadores de su especie hermana P. infestans. Caracterizamos y comparamos los repertorios efectores de P. betacei y otras especies de Phytophthora. Con este fin, utilizamos enfoques in silico para predecir y describir el repertorio de proteínas secretadas en especies de Phytophthora y determinar efectores únicos y centrales. P. betacei tiene el proteoma y secretoma más grandes de todas las especies de Phytophthora evaluadas. Identificamos entre 450 y 1933 genes efectores candidatos en los genomas de P. ramorum, P. sojae, P. cactorum, P. parasitica, P. palmivora, P. infestans y P. betacei. El secretoma predicho de P. betacei contiene 5653 proteínas, 1126 de las cuales son efectores apoplásicos y 807 efectores citoplásmicos. Magíster en Biología Computacional Maestría
- Published
- 2021
14. Estudio de redes de regulación transcripcional mediante maximización de la expectación
- Author
-
Holgado Chicharro, Daniel, Universitat Autònoma de Barcelona. Escola d'Enginyeria, Serra-Sagristà, Joan, and Serra Sagristà, Joan
- Subjects
CGB ,NCBI ,E-utilities ,Ete3 ,Comparative genomics ,Genómica comparativa ,LASAGNA ,Factor de transcripción ,Transcription factor ,Redes de regulación transcripcional ,BLAST ,Biopython ,Transcriptional regulatory networks - Abstract
Descripción, desarrollo e implementación de nuevas funcionalidades para CGB. CGB es un software que se basa en el uso de métodos de genómica comparativa para analizar redes de regulación transcripcional. Las nuevas funciones introducidas son la implementación de la obtención automática de genomas para el input de CGB y introducción de algoritmos de alineamientos de secuencias para los motivos de referencia. Description, development and implementation of new functionalities for CGB. CGB is a software that is based on the use of comparative genomics methods to analyse transcriptional regulatory networks. The new functions introduced are the implementation of automatic genome retrieval for CGB input and introduction of sequence alignment algorithms for reference motifs. Descripció, desenvolupament i implementació de noves funcionalitats per a CGB. CGB és un programari basat en l'ús de mètodes de genòmica comparativa per analitzar xarxes de regulació transcripcional. Les noves funcions introduïdes són la implementació de l'obtenció automàtica de genomes per a l'input de CGB i la introducció d'algorismes d'alineaments de seqüències per als motius de referència.
- Published
- 2021
15. Montagem e análise do genoma de Bacillus vallismortis TIM68: uma bactéria produtora de biossurfactantes
- Author
-
Duarte, Igor Oliveira, Melo, Vânia Maria Maciel, and Lima, Nicholas Costa Barroso
- Subjects
Lipopeptídeos ,Genômica comparativa ,Biossurfactantes - Abstract
Surfactants are applied in several industrial processes when the modification of interface activity and the stability of colloidal systems are required. Lipopeptides are a class of microbial biosurfactants produced by species of the Bacillus genus. They are molecules with up to ten amino acid residues, linked to a -hydroxy or a -amino fatty acid, and are synthesized nonribosomally. The strain Bacillus vallismortis TIM68, isolated from the Timonha mangrove (Ceará, Brazil), was previously characterized as a lipopeptide producer, and had its genome sequenced (Illumina MiSeq platform). The present study aimed at assembling and analyzing the genome of TIM68 in the search for genes involved in lipopeptide synthesis. The de novo assembly was performed with Newbler, and gaps found in genes of interest were closed manually and with the aid of Phrap and GapFiller tools. The genome was also screened for common virulence factors and antibiotics resistance genes to investigate the strain biosafety. Comparative genomics analyses, i.e., synteny, average nucleotide identity (ANI) and pangenome, were also carried out using strain TIM68 and publicly available B. vallismortis complete and partial genomes. The final assembly was 3,938,504 bp long, divided in 36 scaffolds ranging from 4,644 bp to 466,983 bp, with N50 equals to 211,138 bp and mean depth of 49.6X. Three peptide synthetase operons were found in TIM68 genome, they were a surfactin A, a mojavensin, which had never been reported in B. vallismortis, and a vallisin, a novel plipastatin-like lipopeptide. No virulence factors that render pathogenicity to the strain have been identified, but a region of prophage, that may contain unknown pathogenic factors, has been predicted. The pangenome of the species was characterized as closed, with 57% of genes integrating the central genome. This is the first genome assembly of a B. vallismortis strain isolated in Brazil, and the results obtained here on the genetic potential of TIM68 strain should contribute to its exploration in biotechnological applications. Surfactantes são compostos ativos de superfície que possuem aplicação em diversos processos industriais em que a modificação de tensão superficial e a estabilização de sistemas coloidais são necessários. Lipopeptídeos são uma classe de biossurfactantes produzidos por espécies de Bacillus. São moléculas de até dez aminoácidos, ligadas a um -amino- ou -hidróxi-ácido graxo e sua síntese ocorre de forma não-ribossomal. A estirpe Bacillus vallismortis TIM68, isolada do manguezal Timonha (Ceará, Brasil), foi previamente caracterizada como produtora de lipopeptídeos e teve o seu genoma sequenciado (plataforma Illumina MiSeq). O presente trabalho teve por objetivo montar e analisar o genoma da estirpe TIM68 em relação à presença dos genes relacionados à síntese de lipopeptídeos. A montagem de novo foi feita com o software Newbler e gaps encontrados em genes de interesse foram fechados manualmente e com auxílio das ferramentas Phrap e GapFiller. O genoma foi também analisado em busca de fatores de virulência e genes de resistência a antibióticos, visando a classificação do nível de biossegurança da estirpe. O genoma de TIM68 foi comparado a genomas públicos de outras quatro estirpes da mesma espécie através de análises de sintenia, identidade nucleotídica média (ANI) e pangenoma. A montagem compreendeu 3.938.504 pb, em 36 scaffolds variando de 4.644 pb a 466.983 pb, com N50 igual a 211.138 pb e profundidade média de 49,6X. Três operons de síntese de lipopeptídeos foram encontrados no genoma: uma surfactina A, uma mojavensina, que nunca havia sido reportada na espécie B. vallismortis, e uma vallisina, um novo lipopeptídeo similar à plipastatina. Não foram identificados fatores de virulência que tornem a estirpe patogênica, porém foi predita uma região de profago que pode conter fatores de patogenicidade desconhecidos. O pangenoma da espécie foi caracterizado como fechado, com 57% dos genes do pangenoma integrando o genoma central. Essa é a primeira montagem de genoma de uma estirpe de B. vallismortis isolada no Brasil, e os resultados aqui obtidos sobre o potencial gênico da estirpe TIM68 devem contribuir para a sua exploração em aplicações biotecnológicas.
- Published
- 2021
16. La rizobacteria Pseudomonas alcaligenes AVO110 induce la expresión de genes relacionados con formación de biofilms en respuesta a exudados de Rosellinia necatrix
- Author
-
Pintado, Adrian, Pérez-Martínez, Isabel, Aragón, Isabel María, Gutiérrez-Barranquero, José A., De-Vicente-Moreno, Antonio, Cazorla-Lopez, Francisco Manuel, and Ramos-Rodriguez, Cayo Juan
- Subjects
Rizobacterias ,Biofilm ,Genómica comparativa ,Rosellinia necatrix ,RNAseq ,Pseudomonas alcaligenes - Abstract
La rizobacteria Pseudomonas alcaligenes AVO110 muestra antagonismo frente al hongo fitopatógeno Rosellinia necatrix. Esta cepa coloniza eficazmente las hifas de R. necatrix y es capaz de alimentarse de sus exudados. Recientemente, hemos publicado la secuencia completa del genoma de P. alcaligenes AVO110. La filogenia de todos los genomas de P. alcaligenes disponibles separa los aislados ambientales, procedentes de agua, junto a la cepa AVO110, de los obtenidos de infecciones de sangre humana y de tejidos de ostras, que agrupan con Pseudomonas otitidis. Análisis del core y del pangenoma de P. alcaligenes han revelado que las cepas de esta especie codifican conjuntos de genes altamente heterogéneos, y que el genoma de AVO110 codifica la región variable más grande y exclusiva de todos ellos (aproximadamente 1,6 Mb y 1795 genes). Los genes exclusivos de AVO110 incluyen un amplio repertorio de genes relacionados con la formación de biopelículas (biofilms), de entre los cuales destacan aquellos modulados transcripcionalmente por exudados de R. necatrix. Uno de estos genes (cmpA) codifica una proteína con dominios GGDEF/EAL específica de cepas de Pseudomonas spp. aisladas de la rizosfera de diversas plantas, de suelo y de agua. También hemos demostrado que CmpA tiene un papel en la formación de biopelículas y que la integridad de su dominio EAL está involucrada en esta función. Este trabajo contribuye a una mejor comprensión del estilo de vida y de la adaptación a nichos específicos de P. alcaligenes, incluido el comportamiento micofágico de la cepa AVO110. Universidad de Málaga. Campus de Excelencia Internacional Andalucía Tech.
- Published
- 2021
17. Análisis comparativo de los sistemas de regulación transcripcional de la absorción del hierro
- Author
-
Ortí Carrió, Sergio, Maceira Duch, Marc, and Erill Sagales, Ivan
- Subjects
motif discovery ,Bioinformática -- TFM ,ADN ,genòmica comparativa ,comparative genomics ,DNA ,genómica comparativa ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
El hierro es un elemento esencial para la supervivencia de la mayoría de las bacterias. Este interviene en su crecimiento y tiene un papel fundamental para la patogénesis de estas. De la misma manera que es esencial, en concentraciones elevadas puede ser tóxico, por lo que precisa de mecanismos para mantener unos niveles constantes. Estos mecanismos conforman la homeostasis del hierro, la cual está regulada en gran parte por la proteína Fur. Esta proteína regula de forma negativa, y algunas veces de forma positiva, la transcripción de varios genes relacionados con la captación de hierro y la patogénesis, por lo que tiene una gran importancia para entender los mecanismos de patogenia y para elaborar posibles tratamientos terapéuticas. En este trabajo se ha estudiado la secuencia de unión al ADN de Fur mediante herramientas de descubrimiento de motivos. A continuación, se ha empleado este motivo encontrado para realizar un análisis de genómica comparativa con CGB. Como resultado de los análisis, se ha obtenido un motivo que sugiere un sitio de unión al ADN de Fur, el cual sigue un modelo propuesto previamente en otro estudio. Tras el análisis de genómica comparativa, se han obtenido elementos regulados por Fur donde se han encontrado diferencias en la regulación para bacterias patógenas y no patógenas, que sugieren un papel de Fur en la patogenia regulando estos genes. Además, se han comparado estos con elementos descritos en la literatura. Iron is an essential element for the survival of most bacteria. Iron intervenes in growth and has a fundamental role in pathogenesis. In the same way that it is essential, it can be toxic in high concentrations, so it requires mechanisms to maintain constant levels. These mechanisms are called iron homeostasis, which is regulated by the Fur protein. This protein regulates negatively, and sometimes positively, the transcription of several genes related to iron uptake and pathogenesis, so it is of great importance to understand the mechanisms of pathogenesis and for developing possible therapeutic treatments. In this work, the Fur DNA binding sequence has been studied using motif discovery tools. We found a motif that was then used to perform a comparative genomics analysis with the tool CGB. As a result of the analyzes, a motif has been obtained that suggests a Fur-binding site, similar to a motif previously proposed in another study. After comparative genomics analysis, elements regulated by Fur have been obtained, where differences in regulation have been found for pathogenic and non-pathogenic bacteria, which suggest a role of Fur in the pathogenesis by regulating these genes. These genes have been compared with elements described in different studies. El ferro és un element essencial per a la supervivència de la majoria dels bacteris. Aquest intervé en el seu creixement i té un paper fonamental per a la patogénesis d'aquestes. De la mateixa manera que és essencial, en concentracions elevades pot ser tòxic, per la qual cosa precisa de mecanismes per a mantenir uns nivells constants. Aquests mecanismes conformen l'homeòstasi del ferro, la qual està regulada en gran part per la proteïna Fur. Aquesta proteïna regula de manera negativa, i algunes vegades de manera positiva, la transcripció de diversos gens relacionats amb la captació de ferro i la patogénesis, per la qual cosa té una gran importància per a entendre els mecanismes de patogènia i per a elaborar possibles tractaments terapèutiques. En aquest treball s'ha estudiat la seqüència d'unió a l'ADN de Fur mitjançant eines de descobriment de motius. A continuació, s'ha emprat aquest motiu trobat per a realitzar una anàlisi de genòmica comparativa amb CGB. Com a resultat de les anàlisis, s'ha obtingut un motiu que suggereix un lloc d'unió a l'ADN de Fur, el qual segueix un model proposat prèviament en un altre estudi. Després de l'anàlisi de genòmica comparativa, s'han obtingut elements regulats per Fur on s'han trobat diferències en la regulació per a bacteris patògens i no patògenes, que suggereixen un paper de Fur en la patogènia regulant aquests gens. A més, s'han comparat aquests amb elements descrits en la literatura.
- Published
- 2021
18. Assembly and comparative analysis of the genomes of the species D. borborema, D. antonietae and D. koepferae (Drosophila buzzatii cluster, repleta group)
- Author
-
Moreyra, Nicolás Nahuel and Hasson, Esteban R.
- Subjects
COMPARATIVE GENOMICS ,SALTO DE HOSPEDADOR ,ADAPTACION ,GENOMICA COMPARATIVA ,FILOGENOMICA ,PHYLOGENOMICS ,ADAPTATION ,HOST SHIFT - Abstract
En este trabajo se presentan los resultados de la secuenciación, ensamblado, anotación estructural, anotación funcional y análisis comparativo de los genomas de especies cactofílicas que conforman el cluster Drosophila buzzatii: D. antonietae, D. borborema, D. koepferae (dos cepas) y D. buzzatii. Este es un grupo de siete especies cercanamente emparentadas del grupo repleta. Todas viven en ambientes áridos, desérticos y semidesérticos de América del Sur, y son capaces de alimentarse de una variada dieta consistente en microorganismos, mayormente levaduras y bacterias, asociados a los tejidos de cactus en descomposición. Entre las cactáceas que explotan como sitios de cría se pueden reconocer dos tipos principales: los cactus columnares de la subfamilia Cactoideae (por ejemplo, los géneros Cereus Trichocereus) y las tunas o peras espinosas de la subfamilia Opuntioidea (principalmente del género Opuntia). Los primeros son los hospedadores primarios de D. antonietae, D. borborema y D. koepferae, en tanto que las tunas son los hospedadores primarios de D. buzzatii, condición considerada como ancestral. Estos dos tipos de cactus difieren notablemente en varios aspectos de su biología, ecología y, particularmente, en su composición química. En este contexto se enmarca el objetivo general de este trabajo, que se propone identificar, desde una perspectiva genómico-comparativa, factores genéticos asociados a la utilización diferencial de recursos naturales química y nutricionalmente diferentes en el sistema modelo Drosophila-cactus. Esta tesis comienza con una introducción a los antecedentes de la genómica y ecología de este grupo de especies que motivaron la realización de misma, junto con los objetivos propuestos y una breve descripción de los restantes capítulos. Posteriormente, se desarrollan dos enfoques analíticos realizados a partir de la secuenciación de cuatro genomas de novo y el re-análisis del genoma disponible de D. buzzatii. Por un lado, se presenta un estudio mitogenómico comparativo, donde se reportan los mitogenomas de estas especies y el de una especie adicional, D. seriema, también miembro del cluster buzzatii, en conjunto con los resultados de la evolución molecular y las relaciones filogenéticas inferidas a partir de los mitogenomas. Por otro lado, se expone un enfoque combinado de estudios filogenómicos y de genómica comparativa, que se dividió en tres partes. Primero, se reportan las métricas y estadísticas estándares de contigüidad y completitud de los ensamblados generados con una metodología de novo: la longitud total, el número de contigs/scaffolds, el valor de N50 y los porcentajes de completitud de distintos conjuntos de genes ortólogos de copia única que se encuentran conservados en diferentes linajes (grupos BUSCO). En segundo lugar, se muestran los resultados de la anotación estructural y funcional, tales como el número de repeticiones, genes, transcriptos y proteínas anotadas, y se compara la calidad de las mismas con las anotaciones disponibles para otras especies. En tercer lugar, se presenta la filogenia más completa reconstruida hasta el momento para este grupo de especies, la cual obtuvo valores de soporte máximos para todos los nodos y que es contradictoria con la hipótesis filogenética generada con los mitogenomas. A continuación, se reporta el conjunto de genes ortólogos exclusivos del grupo de especies cactófilas, que se obtuvieron a partir de un análisis comparativo que incluyó a las especies del cluster buzzatii, a D. mojavensis (que forma parte del complejo mulleri, que es el grupo hermano del complejo buzatii) y a especies externas no cactofílicas, del mismo subgénero Drosophila y del subgénero Sophophora. Otras comparaciones permitieron identificar, además, conjuntos de genes exclusivos del cluster buzzatii y de las especies que explotan cactus columnares. Las funciones asociadas a estos dos conjuntos de genes fueron coherentes con las supuestas características necesarias para la utilización de recursos naturales química y nutricionalmente diferentes, y que podrían estar asociadas a la preferencia de distintas plantas hospedadoras. Adicionalmente, se presenta un estudio de evolución molecular de la familia de proteínas citocromo P450 (CYP450), conocida por estar relacionada con mecanismos de detoxificación, donde se muestra la expansión y contracción de la misma en relación con el cluster mojavensis. Por último, en base a todos los resultados obtenidos, en las conclusiones generales se destacan los principales aportes de este trabajo. This work presents the results of the sequencing, assembly, structural annotation, functional annotation, and comparative analysis of the genomes of cactophilic species which belong to the Drosophila buzzatii cluster: D. antonietae, D. borborema, D. koepferae (two strains) and D. buzzatii. This group is an ensemble of seven closely related species of the repleta group. These species inhabit arid, desert and semi-desert environments of South America, and are able to feed on a varied diet consisting of microorganisms, mostly yeasts and bacteria, associated with decaying cactus tissues. Regarding host plant use, two main types can be recognized: the columnar cacti of the subfamily Cactoideae (e.g. the genera Cereus and Trichocereus) and the prickly pears of the subfamily Opuntioidea (mainly genus Opuntia). D. buzzatii is an Opuntia specialist, considered an ancestral condition, while D. antonietae, D. borborema, and D. koepferae are mainly columnar dwellers. These two types of cactus differ markedly in several aspects of their biology, ecology, and mostly in their chemical composition. In this sense, this work aims to identify, using a comparative genomics approach, the genetic factors associated with the preference and use of chemically and nutritionally different natural resources in the Drosophila-cactus model system. At the beginning of this work, the genomic and ecological backgrounds of this species group, which encouraged the development of this Ph.D. thesis, are introduced/described, together with the proposed objectives and a brief description of each chapter. Subsequently, two analytical approaches carried out with the de novo sequencing of four genomes and the reanalysis of the genome of D. buzzatii are described. Then, a comparative mitogenomic study is presented, where the mitogenomes of these species and D. seriema, an additional species member of the buzzatii cluster, are reported. The results of a molecular evolution study and the phylogenetic relationships inferred using the mitogenomes are also shown. Afterward, an approach that combined phylogenomic and comparative genomic studies, which was divided into three parts, is presented. First, the standard contiguity and completeness metrics for genome assemblies are reported: total length, number of contigs/scaffolds, N50 value, and the percentages of completeness of different sets of single-copy orthologs genes conserved in different lineages (BUSCO groups). Secondly, the results of the structural and functional annotations are shown, such as the number of repeats, genes, transcripts, and proteins annotated, and the quality results are compared to available annotations for other species. Thirdly, the most complete phylogeny reconstructed to date for this species group is reported, which obtained maximum bootstrap values for all nodes and which is against the phylogenetic hypothesis inferred using mitogenomes. Next, the set of exclusive cactophilic species orthologs genes and their functions are reported, which was obtained through a comparative analysis that included the species of the buzzatii cluster, D. mojavensis (part of the mulleri complex, which is the sibling group of the buzatii complex) and external non-cactophilic species that belong to the same subgenus Drosophila and the subgenus Sophophora. Other comparisons allowed to identify sets of exclusive genes in the buzzatii cluster and in the species that only exploit columnar cacti. The functions associated to these two gene sets were consistent with the presumed characteristics that are required for the use of chemically and nutritionally different natural resources, and which could be associated with the preference of different host plants. In addition, a molecular evolution study of the cytochrome P450 (CYP450) protein family, well known to be related to detoxification mechanisms, is presented, and the expansion/contraction of this family in comparison with the mojavensis cluster is also shown. Finally, based on all the obtained results, the main contributions of this work are highlighted in the general conclusions. Fil: Moreyra, Nicolás Nahuel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
- Published
- 2020
19. Populational structure and evolutionary scenario of the multidrug-resistant pathogen Enterococcus faecium in hospital institutions in Rio de Janeiro
- Author
-
Souza, Stephanie da Silva Rodrigues de, rodrigues_stephanie@hotmail.com, Merquior, Vania Lucia Carreira, Teixeira, Lúcia Martins, Leão, Robson de Souza, Neves, Felipe Piedade Gonçalves, Assef, Ana Paula D’Alincourt Carvalho, and Silva, Carla Alexandra Novais de Oliveira e
- Subjects
Evolução bacteriana ,Genômica comparativa ,Whole-genome sequencing ,Epidemiologia molecular ,Enterococcus faecium ,Enterococcus faecium – Genética ,Population structure ,Evolução molecular ,Sequenciamento do genoma completo ,Bacterial evolution ,MICROBIOLOGIA::MICROBIOLOGIA APLICADA::MICROBIOLOGIA MEDICA [CIENCIAS BIOLOGICAS] ,Estrutura populacional ,Resistência aos antimicrobianos ,Comparative genomic ,Farmacorresistência bacteriana ,Antimicrobial Resistance - Abstract
Submitted by Kalina CB/A (kalikros2@gmail.com) on 2021-11-10T20:48:09Z No. of bitstreams: 1 Tese - Stephanie Stephanie da Silva Rodrigues de Souza - 2020.pdf: 5223065 bytes, checksum: 010f2fd1b9588130b5f9eadc71d58e28 (MD5) Made available in DSpace on 2021-11-10T20:48:09Z (GMT). No. of bitstreams: 1 Tese - Stephanie Stephanie da Silva Rodrigues de Souza - 2020.pdf: 5223065 bytes, checksum: 010f2fd1b9588130b5f9eadc71d58e28 (MD5) Previous issue date: 2020-09-14 Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES Enterococcus faecium stands out as an opportunistic pathogen frequently associated with hospital-acquired infections around the world. The aim of this study was to determine the population structure among E. faecium isolates recovered in hospitals of Rio de Janeiro city, Brazil, over a period of eight consecutive years (2009 to 2016) and to evaluate the genetic events related to the evolution of hospital-adapted clonal lineages. The bacterial isolates were initially characterized according to their susceptibilites to antimicrobial agents, evaluated by the disk-diffusion method, and to the presence of genetic determinants associated with resistance to antimicrobial agents and with virulence, investigated by PCR assays. Based on the results obtained, 52 strains were subsequently selected for whole-genome sequencing (WGS) using the Illumina Hiseq platform. In addition, another 22 strains belonging to the hospital-adapted lineage ST78, previously predominant in the city hospital institutions, were included for comparative purposes. An extensive pipeline of bioinformatics tools was implemented to reconstruct phylogenetic relationships and analyze different genetic aspects of the evolution of the 74 strains studied. Phylogenetic analyses indicated the occurrence of multiple lineage changes over time. ST78 was predominant among isolates recovered from 2002 to 2008, being replaced by the emergence of ST412. This lineage was predominant until 2012, when two new lineages have emerged: ST963 in 2013, and ST896 in 2015. Genome analyses revealed different mechanisms associated with the evolution of these lineages. ST78 had its emergence and expansion associated with the enlargement of the acessory genome, with a high number of insertion sequences (ISs) and prophages. Moreover, the exclusive presence of a toxin-antitoxin system, involved in the stabilization of mobile genetic elements (MGE), corroborated these findings. On the other side, the emergence of ST412, observed in two distinct waves, was associated with several recombination events in the ancestor nodes. Additionally, a high number of SNPs, possibly related to the formation of hypermutantes due to a stop codon acquisition in a DNA repair system, and the exclusive acquisition of cell wall biogenesis genes, were associated with the expansion of this lineage. Recombination events in the ancestor nodes were detected in the ST963 and ST896 lineages. ST896 had the lowest number of acessories genes, but a frequent presence of antibiotic resistance was strongly associated with this group. The expansion of ST963 was accompanied by the exclusive acquisition of genes related to amino acid metabolism and biosynthesis of secondary metabolites. A large number of genetic novelty units (GNU) was observed in this group. Some features such as the presence of drfF gene (trimethoprim resistance), virulence determinant hyl, the ISLgar5 and the allele 44 to purK gene were also related to the lineages that replaced ST78. Overall, our results indicate that the E. faecium population investigated has undergone successive lineage replacement in a dynamic evolutionary process. The data highlighted the different genetic events that may play a role in the emergency of specialized subpopulations adapted to the hospital environment and endorse the need of continuous monitoring the infections caused by this microorganism. Enterococcus faecium se destaca como um patógeno oportunista frequentemente associado a infecções hospitalares em todo o mundo. O objetivo deste estudo foi determinar a estrutura populacional de amostras de E. faecium isoladas em instituições hospitalares do estado do Rio de Janeiro, durante um período consecutivo de oito anos (2009 a 2016), e avaliar os eventos genéticos relacionados à evolução de linhagens adaptadas ao ambiente hospitalar. As amostras bacterianas foram inicialmente caracterizadas quanto à suscetibilidade aos antimicrobianos, avaliada pelo método de disco-difusão, e à presença de determinantes genéticos associados à resistência a antimicrobianos e a virulência, investigada por técnicas de PCR. Com base nos resultados obtidos, 52 amostras foram selecionadas para realização de sequenciamento do genoma completo (WGS) com o auxílio da plataforma Illumina Hiseq. Além dessas, outras 22 amostras pertencentes à linhagem hospitalar ST78, anteriormente circulante no estado, foram incluídas para fins comparativos. Um extenso pipeline de ferramentas de bioinformática foi empregado para reconstruir as relações filogenéticas e investigar diferentes aspectos genéticos do processo evolutivo das 74 amostras analizadas. As análises filogenéticas indicaram a ocorrência de múltiplas alterações populacionais ao longo do tempo. A linhagem ST78 foi predominante no período de 2002 a 2008, sendo posteriormente substituída pela ST412. Essa linhagem predominou até 2012, quando então, duas novas surgiram: ST963 em 2013 e ST896 em 2015. As análises do genoma revelaram diferentes mecanismos genéticos associados à evolução dessas linhagens. A linhagem ST78 teve seu surgimento e expansão associados ao aumento do genoma acessório, com um elevado número de sequências de inserção (IS) e profagos. Além disso, a presença exclusiva de um sistema toxina-antitoxina, envolvido na estabilização de elementos genéticos móveis (EGM), corroborou os resultados encontrados. Por outro lado, o surgimento da linhagem ST412, observada em duas ocasiões distintas, foi associado a eventos de recombinação nos nodos ancestrais. Ademais, um número elevado de SNPs, possivelmente relacionado à formação de hipermutantes devido ao ganho de um códon de parada em um sistema de reparo de DNA, e o ganho exclusivo de genes de biossíntese da parede celular, também foram associados à expansão desta linhagem. Eventos de recombinação foram detectados nos nodos ancestrais das linhagens ST963 e ST896. O ST896 teve o menor número de genes acessórios, entretanto esteve fortemente associado a uma maior presença de genes de resistência aos antimicrobianos. A expansão da ST963 foi acompanhada, particularmente, do ganho exclusivo de genes relacionados ao metabolismo de aminoácidos e de metabólitos secundários. Um número elevado de unidades de novidade genética (GNU) foi observado nesse grupo. Algumas características, tais como a presença do gene dfrF (resistência ao trimetoprim), do determinante de virulência hyl, da ISLgar5 e o alelo 44 do gene purK, também foram associadas às populações que substituíram a ST78. No geral, nossos resultados indicam que a população de E. faecium investigada sofreu sucessivas substituições de STs, associadas a um processo evolutivo dinâmico. Os dados evidenciam os diferentes eventos genéticos que podem ter desempenhado papel importante na emergência de subpopulações especializadas, e reafirmam a necessidade de constante monitoramento das infecções causadas por esse microrganismo.
- Published
- 2020
20. Caracterización fenotípica y genotípica de cepas de Escherichia coli productoras de toxina shiga (0157 y NO-0157) provenientes de alimentos, ganado y casos clínicos: identificación de nuevos blancos útiles para su detección y control
- Author
-
Vázquez Zeballos, Sylvia Enid, Varela, Gustavo, Iriarte, Andrés, Norbis, Walter, and Vázquez Zeballos Sylvia Enid
- Subjects
Genes de virulencia ,Genes de resistencia ,PFGE ,Genomica comparativa ,E. coli enterohemorragica ,STEC ,ENFERMEDADES INFECCIOSAS ,GENETICA ,GENOTIPO ,Clados ,Secuenciacion genomica ,FENOTIPO ,Serotipos ,ESCHERICHIA COLI ,BACTERIAS ,Marcadores moleculares ,MLST - Published
- 2020
21. El Genoma en los Cordados: Introducción a la Genómica Comparada.
- Author
-
Ávila, Rodolfo E., Samar, María Elena, Díaz-Beltrán, Leticia, and Esteban, Francisco J.
- Subjects
- *
CHORDATA , *COMPARATIVE genomics , *VERTEBRATES , *SEQUENCE alignment , *COMPUTATIONAL biology , *COMPARATIVE studies , *CARTOGRAPHY - Abstract
The aim of this paper is to briefly describe concepts of genomics of chordates and comparative genomics and its ethical aspects. The genome of chordates changed slightly resulting in the genome of vertebrates, including mammals. The human being belongs to the phylum chordates. Comparative genomics studies the similarities and differences between genomes of different organisms, trying to explain the information provided by natural selection to understand the function and evolutionary processes that act on genomes. Evolutive processes' complexity is considered a major challenge in terms of analyzing and interpreting all the biological information generated; in this sense, Bioinformatics and Computational Biology provide an enormous range of statistical, mathematical and algorythmical techniques for biological data analyses. A key challenge for bioinformatics is to analyze the flow of DNA sequence data to understand the information stored in terms of structure, function and protein evolution. BLAST and ClustalW2 tools are used for the analysis of multiple sequence alignments in Computational Biology. Genomics is also playing a key role in Medicine; human genome's cartography provides valuable information to detect genes involved in certain diseases. It entails that nowadays it is better to focus on prediction much more than on prevention. The current tendency is that in the future Genomic Medicine will displace Preventive Medicine. The Human Genome Project implies diverse applications that do not have clear legal coverage. This brings a new paradigm with ethical, social and legal problems that the scientific community is trying to resolve in order to combine morality and research progress. [ABSTRACT FROM AUTHOR]
- Published
- 2012
- Full Text
- View/download PDF
22. Computational approach to stablish an identification scheme of Mycobacterium tuberculosis using genomic sequences
- Author
-
Iván Alexander, Duque Aldana, Niño Vásquez, Luis Fernando, and LABORATORIO DE INVESTIGACIÓN EN SISTEMAS INTELIGENTES - LISI
- Subjects
Tecnología (Ciencias aplicadas) ,Comparative Genomics ,Whole Genome sequencing ,Sequence clustering ,Machine learning ,Bioinformatics ,Ciencias naturales y matemáticas ,Genómica Comparativa ,Secuenciamiento de Genoma completo ,Agrupamiento de secuencias ,Aprendizaje de Máquina ,Bioinformática - Abstract
El complejo Mycobacterium tuberculosis es un grupo de agentes patógenicos caracterizados principalmente por causar tuberculosis en distintos animales. En la actualidad métodos más eficientes y efectivos para identificar el patógeno a nivel de especie son requeridos tomando provecho de los datos obtenidos por técnicas de secuenciamiento de genoma completo. A lo largo de este trabajo se expone una manera distinta para abarcar el problema de identificación de genomas como uno de clasificación en el área de aprendizaje de máquina, agregando pasos adicionales en comparación con los pipelines de preprocesamiento actuales e incluyendo regiones intergénicas para de esta manera abarcar el total de la información genómica en cada muestra. Adicionalmente, un conjunto de genomas del género Mycobacterium fue seleccionado para entrenar el modelo y de esta manera identificar las diferencias más relevantes a través de una búsqueda de homología y construir una representación del genoma a partir de agrupamientos iterativos y con índices de variablidad fijos que permitieran visualizar grupos de secuencias candidatas para la diferenciación. Entre los resultados del presente trabajo se entrenó un modelo que establece un conjunto de secuencias representativas por su cáracter discriminatorio y que sugieren una firma a partir de la comparación entre dos grupos de especies, además de permitir asignar nuevas muestras a una de las dos categorías taxonómicas de interés basada en sus agrupaciones de secuencias de ADN más relevantes. También se construyó una nueva herramienta de evaluación para los métodos in silico actuales basados en técnicas de tipificación, obteniendo mejores métricas para la clasificación al utilizar la implementación resultante del presente trabajo. The Mycobacterium tuberculosis Complex is a pathogenic agent group, characterized by being the cause of tuberculosis disease in different animals. Nowadays, more efficient and effective methods to identify the pathogen at the species level are required, taking advantage of the data obtained by Whole-genome sequencing techniques. The target of this study is to expose a different way to face the problem of genome identification dealing with it as one of classification in the Machine learning area, but including additional steps in comparison with the current preprocessing pipelines, mainly including intergenic regions to cover the total of the genomic information for each sample. Additionally, a sample of genomes of the Mycobacterium genus was selected to train the model and in this way to identify the most relevant differences through homology search and building a genome representation based on iterative clustering with fixed variable indices that allows to visualize groups of candidate sequences for differentiation. Among the results of this work, a model that establishes a set of representative sequences by their discriminative power suggests a signature from the comparison between two groups of species, and allows to assign new samples to one of the taxonomic categories of interest and based on their DNA clusters more relevant. Additionally, a new evaluation tool to compare the current in silico typing methods was built, obtaining better metrics for the classification with the implementation resulting from this work. Colciencias Identificación de Bioperfiles de Mycobacterium tuberculosis a partir de la integración de información heterogénea mediante biología de sistemas Maestría en Bioinformática. Línea de Investigación: Tecnologías computacionales en Bioinformática. Maestría
- Published
- 2019
23. A evolução da complexidade biológica em Eukarya: funções biológicas e domínios de proteínas associados ao número de tipos celulares diferentes
- Author
-
Dalbert Benjamim da Costa, Francisco Pereira Lobo, Romeu Cardoso Guimarães, and Gustavo Campos e Silva Kuhn
- Subjects
Genômica comparativa ,Gene Ontology ,Eukarya ,Complexidade biológica ,Domínio de proteínas ,Eucariotos ,Número de diferentes tipos de células ,Genômica ,Pfam ,Ontologia genética ,Genética ,Biologia computacional - Abstract
CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior Durante o curso da evolução biológica de eucariotos, organismos com diferentes graus de complexidade emergiram. Para fins práticos, o número de tipos celulares distintos tem sido comumente utilizado como um proxy para a complexidade biológica. Também durante o curso da evolução, novas proteínas emergiram em Eukarya como resultado de evolução de novo, duplicações gênicas seguidas por divergência e, em vários casos, embaralhamento de domínios (domain shuffling). Utilizamos uma abordagem estatística e de genômica comparativa para estudar a evolução da complexidade biológica em eucariotos, pesquisando por funções biológicas (representadas como a frequência de domínios de proteínas e de funções gênicas codificadas em uma ampla gama de genomas eucarióticos) associadas ao seu número de tipos celulares diferentes. Para tal, inicialmente selecionamos 41 proteomas não-redundantes eucarióticos de alta qualidade em termos de completude do repertório gênico, estimado pelo software BUSCO, e que possuam informação sobre o número de tipos celulares. Para os proteomas selecionados, realizamos a anotação dos mesmos usando o programa InterProscan, de modo a detectarmos quais são os domínios protéicos (identificados no banco de dados Pfam) e quais funções biológicas (identificados por termos Gene Ontology) codificados nestes genomas. Buscamos dois tipos de associação entre as frequências de domínios/termos GO em cada proteoma não-redundante e o número de diferentes tipos de células para as espécies correspondentes. Uma das associações consiste na correlação de Spearman, sendo o outro tipo de modelo corrigido de modo a levar em consideração a história filogenética das espécies analisadas, de modo a eliminar possíveis dependências dos dados em função da origem evolutiva comum dos organismos em análise. Para ambos computamos valores p, os quais são posteriormente corrigidos em função do cenário de múltiplas hipóteses (BH). Consideramos como positivos os modelos onde obtivemos valores p corrigidos menores que p ≤ 0.05. Encontramos 256 domínios Pfam e 304 funções biológicas que desempenham papéis importantes nos processos de matriz extracelular, interação célula-célula, fatores de transcrição, hormônios, processos regulatórios e fatores-chave para diferenciação celular e processos de desenvolvimento corporal. Em conjunto, nossa abordagem destaca importantes processos biológicos associados ao aumento da complexidade em Eukarya, sugerindo sua importância para o estabelecimento da complexidade biológica existente. During the course of biological evolution, organisms with different degrees of complexity have arisen. For practical purposes, the number of distinct cell types has been commonly used as a proxy for biological complexity. Also during the course of evolution, new proteins emerged in Eukarya as the result of de novo gene evolution, gene duplications followed by divergence and, in several cases, functional domain shuffling. We used a statistical comparative genomics approach to study the evolution of biological complexity in Eukarya by searching for biological functions (represented as the frequency of protein domains and gene functions coded in a wide range of eukaryotic genomes) associated with their number of cell types. We selected 41 high-quality non-redundant eucaryotic proteomes in terms of gene repertoire completeness as estimated by BUSCO and, for each proteome was annotated to identify protein domains (Pfam) and biological functions (Gene Ontology - GO - terms) using InterProScan. We compute two classes of association metrics for the frequencies of each Pfam/GO term and the number of cell types. One class consists on traditional Spearman correlation, while the other is corrected to take into account the common ancestry relationships across species data, therefore correcting for this bias. For each linear model we computed p-values, and we applied multiple hypothesis correction (BH methods) to take into account the multiple-comparison problem. We considered as positive models with corrected p-values smaller than 0.05 resulting in 256 Pfam domains and 304 GO terms significantly associated with biological complexity. Among these sets we found several domains that play important roles in extracellular matrix processes, cell-cell interaction, transcription factors, hormones, regulatory processes and key factors for cell differentiation and body development processes. Taken together, our approach highlights important biological processes associated with the increase of complexity in Eukarya, suggesting their importance for the establishment of extant biological complexity.
- Published
- 2019
24. Inferencia de los genes del ancestro de los amniotas y su relación con el origen del huevo
- Author
-
Lavín Cabanas, María, Irisarri Aedo, Iker, and Universidad de Cantabria
- Subjects
Ganancia y pérdida de genes ,Evolution ,Comparative genomics ,Ontología de genes ,Amniota ,Homología ,Homology ,Evolución ,Huevo ,Amniote ,Egg ,Genómica comparativa ,Gene ontology ,Genomes ,Gene gain and loss ,Genomas - Abstract
Amniotes are the first fully terrestrial vertebrate animals with several evolutionary innovations in their common ancestor that allowed them to become fully independent of the aquatic environment, including a more complex egg with shell and additional structures. During evolution, organisms’ form and functions evolve, and so do their genomes, which are the ultimately responsible for the observed changes. In fact, genomes are evolutionarily labile and experience changes in gene content and structure. This Project aims to investigate the genomic basis for the origin of amniotes and their evolutionary innovations. From a bioinformatic point of view, this work involves: (i). choosing the highest quality vertebrate genomes to use in our analysis; (ii). estimating the genes that originated in the common ancestor of reptiles, birds and mammals by searching for sequence similarity and clustering of homologous genes; (iii). functionally characterizing the novel genes that originated in the common ancestor of amniotes and identifying any relationship with the origin of the amniote egg. RESUMEN: Los amniotas son los primeros animales vertebrados completamente terrestres con varias innovaciones evolutivas en su ancestro común que les permitió independizarse totalmente del entorno acuático, entre ellos un huevo más complejo con cáscara y estructuras adicionales. Durante la evolución, el aspecto y la función de los organismos evolucionan, al igual que sus genomas, que son los responsables de las transformaciones observadas. De hecho, los genomas están constantemente sometidos a cambios debido a la evolución y experimentan modificaciones en el contenido y la estructura de los genes. El objetivo principal de este proyecto es investigar la base genómica del origen de los amniotas y sus innovaciones evolutivas. Desde un punto de vista bioinformático, este trabajo implica: (i). seleccionar los genomas de vertebrados de mayor calidad para usarlos en nuestro análisis; (ii). Estimar los genes nuevos que se originaron en el ancestro común de reptiles, aves y mamíferos mediante la búsqueda de similitud de secuencias y agrupamiento de genes homólogos; (iii). caracterizar funcionalmente los genes inferidos como nuevos en el ancestro de los amniotas e identificar una posible relación con el origen del huevo amniota. Máster en Ciencia de Datos
- Published
- 2019
25. Estudio de genómica comparada de genes bacterianos relacionados con la proliferación en la rizosfera
- Author
-
Gomila Ubero, Maria José and Pizarro Tobías, Paloma
- Subjects
bacterial genes ,Bioinformática -- TFM ,gens bacterians ,plant growth-promoting rhizobacteria ,genòmica comparativa ,comparative genomics ,rizobacterias que estimulan el crecimiento de las plantas ,rizobacteries que estimulen el creixement de les plantes ,genes bacterianos ,genómica comparativa ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
Pseudomonas is a taxonomically diverse genus that harbors one of the most studied species for its mutualistic relationship with plants at the rhizosphere level, Pseudomonas putida. It is considered a rhizobacteria that promotes plant growth, also knows as a PGPR (Plant-Growth Promoting Rhizobacteria). The different stages of colonization have been defined, being the adhesion, the biosynthesis of flagella and the adaptation to stress, essential characteristics to carry out an optimal colonization of the rhizosphere, as well as the genes involved in the different stages of colonization. The RpoN and FliA genes have been described as genes involved in biosynthesis, the RelA gene is related to stress adaptation and the GalU gene is described as involved in the later stages of colonization. This work carries out a study on selection by comparative genomics, determining the relationship between the structure and the function of the genes RpoN, FliA, RelA and GalU, through the different species and strains of Pseudomonas. Pseudomonas es un género taxonómicamente muy diverso que alberga una de las especies más estudiada por su relación mutualista con las plantas a nivel de la rizosfera, Pseudomonas putida. Está considerada una rizobacteria que promueve el crecimiento de la planta, también conocida como una PGPR (Plant-Growth Promoting Rhizobacteria). Se han definido las distintas etapas de colonización, siendo la adhesión, la biosíntesis de flagelos y la adaptación al estrés, características esenciales para llevar a cabo una colonización óptima de la rizosfera, así como los genes implicados las distintas etapas de la colonización. Los genes RpoN y FliA han sido descritos como genes implicados en la biosíntesis, el gen RelA está relacionado con la adaptación al estrés y el gen GalU se describe implicado en las etapas más tardías de la colonización. Este trabajo lleva a cabo un estudio sobre la selección mediante la genómica comparada, determinando la relación entre la estructura y la función de los genes RpoN, FliA, RelA y GalU, a través de las distintas espécies y cepas de Pseudomonas. Pseudomonas és un gènere taxonómicament molt divers que alberga una de les espècies més estudiada per la seva relació mutualista amb les plantes a nivell de la rizosfera, Pseudomonas putida. Està considerada una rizobacteria que promou el creixement de la planta, també coneguda com una PGPR (Plant- Growth Promoting Rhizobacteria). S'han definit les diferents etapes de colonització, sent l'adhesió, la biosíntesi de flagels i l'adaptació a l'estrès, característiques essencials per a dur a terme una colonització òptima de la rizosfera, així com els gens implicats les diferents etapes de la colonització. Els gens RpoN i FliA han estat descrits com a gens implicats en la biosíntesi, el gen RelA està relacionat amb l'adaptació a l'estrès i el gen GalU es descriu implicat en les etapes més tardanes de la colonització. Aquest treball duu a terme un estudi sobre la selecció mitjançant la genòmica comparada, determinant la relació entre l'estructura i la funció dels gens RpoN, FliA, RelA i GalU, a través de les diferents espécies i ceps de Pseudomonas.
- Published
- 2019
26. Estrategia de modificación metabólica de una cepa nativa de Clostridium para la producción De 1,3-Propanodiol a partir de Glicerol
- Author
-
Perez Mancilla, Ximena Carolina, Riaño Pachon, Diego Mauricio (Thesis advisor), and Montoya Castano, Dolly
- Subjects
Clostridium ,Transcriptoma ,Genome ,Comparative genomics ,1,3-Propanediol ,Genómica comparativa ,1,3-Propanodiol ,Metabolic network ,Red metabólica ,Transcriptome ,Genoma - Abstract
El incremento de la producción de fuentes energéticas alternativas como biodiesel ha conllevado a estudiar la posibilidad de establecer biorrefinerías donde se haga uso del subproducto glicerol sin purificar como sustrato para la producción de 1,3-Propanodiol (1,3-PD) por parte de microorganismos del género Clostridium. Con el propósito de establecer una estrategia de modificación genética a partir del análisis del transcriptoma de Clostridium sp. IBUN13A para la producción de 1,3-PD se obtuvo inicialmente su genoma, lo que otorgó un panorama global del potencial metabólico de la cepa, así como la base de la construcción de un modelo metabólico. Así mismo se realizó un estudio de genómica comparativa entre 32 cepas del género, mostrando que este tiene una amplia plasticidad génica. Tomando en cuenta la tendencia actual de comprender globalmente la información que se puede obtener a partir de técnicas moleculares de punta y generar modelos predictivos de los organismos vivos a partir de la biología de sistemas, se utilizó la red metabólica obtenida previamente dentro del grupo de investigación para implementar estrategias de manipulación in silico de triples mutantes, que nos permitieron evaluar la viabilidad de modificar de forma racional al microorganismo y para lo que no se encontraron incrementos en el rendimiento molar del diol de más de 2%. De igual forma se establecieron las diferencias en el perfil transcriptómico global de la cepa en cultivo con glicerol respecto a glucosa, lo cual es fuente de información sobre la fisiología de esta bacteria y sobre posibles blancos de manipulación genética. Abstract: The increase in the production of alternative energy sources such as biodiesel, has encouraged the study about the possibility of establishing biorefineries where glycerol (byproduct of this process) can be used without purifying as a substrate to produce 1,3-propanediol (1,3-PD) by microorganisms of the genus Clostridium. In order to establish a genetic modification strategy based on the analysis of the transcriptome of Clostridium sp. IBUN13A for producing 1,3-PD, at first its genome was obtained, which gave an overview of the metabolic potential of the strain, as well as the basis of the construction of a metabolic model. Likewise, a study of comparative genomics was carried out among 32 strains of the genus, showing that it has a broad genetic plasticity. Taking into account the current trend of globally understanding the information that can be obtained from cutting-edge molecular techniques and generating predictive models of living organisms from Systems Biology, we used the metabolic network previously obtained within the research group to implement strategies of in silico manipulation of triple mutants, which allowed us to evaluate the feasibility of modifying the microorganism rationally and for which no were found increases in the molar yield of the alcohol of more than 2%. Also, the differences in the global transcriptomic profile of the strain cultured with glycerol were established with respect to glucose, which is a source of information about the physiology of this strain and possible targets of genetic manipulation. Doctorado
- Published
- 2019
27. Análise evolutiva baseada no genoma de Pasteurella multocida proveniente de isolados veterinários
- Author
-
Raquel Enma Hurtado Castillo, Vasco Ariston de Carvalho Azevedo, and Flávia Figueira Aburjaile
- Subjects
Genômica comparativa ,Pasteurella multocida ,Filogenômica ,Genômica ,Evolução biológica ,Adaptação evolutiva ,Pangenoma ,Diversidade genômica ,Biologia computacional ,Genoma - Abstract
Pasteurella multocida é um patógeno comensal e oportunista que causa várias doenças como pneumonia, rinite atrófica, cólera aviária e septicemia hemorrágica em diferentes hospedeiros. Essas doenças causam um alto índice de morbidade e mortalidade, resultando em grandes prejuízos econômicos a nível mundial. No Peru, P. multocida é o principal agente causador de pneumonias, possuindo alta taxa de mortalidade em neonatos e filhotes de alpacas na época das geladas, o qual representa uma grande problemática, uma vez que a produção de alpacas é um dos principais recursos econômicos da região dos Andes. Nesse contexto, é essencial o conhecimento de características genômicas da espécie P. multocida para o desenvolvimento de estratégias futuras para controle e prevenção dessas doenças. Por esse motivo, foi sequenciada a linhagem UNMSM isolada de uma alpaca com pneumonia e 22 linhagens de P. multocida foram recuperadas da base de dados National Center for Biotechnology Information (NCBI). Com o objetivo de decifrar a diversidade genética e o processo adaptativo de P. multocida, este trabalho realizou análises filogenômicas e pangenômicas de isolados de distintas doenças e hospedeiros dessa espécie. Análises de seleção positiva, predição de ilhas genômicas e de genes componentes do genoma acessório foram realizadas nos grupos fenotípicos estabelecidos. Como resultado, comprovou-se a patogenicidade da linhagem UNMSM devido à presença dos principais genes de virulência da espécie e da presença de ilhas de patogenicidade. Entretanto, a análise filogenética demostrou que a linhagem UNMSM diverge das demais linhagens do grupo que causam a pneumonia. A análise da diversidade baseada na filogenia de nucleotídeos, aminoácidos e presença e ausência de genes demonstrou a concordância do agrupamento de linhagens aos grupos fenotípicos estabelecidos. A análise da diversidade por filogenia baseada na presença e ausência de genes, mostrou uma maior variabilidade no mesmo grupo. Em relação aos estudos de pangenoma, os genes acessórios codificam proteínas associadas ao metabolismo e transporte de carboidratos, aminoácidos, biogênese e membrana de parede celular e proteínas hipotéticas. A presença desses grupos funcionais como parte do genoma acessório sugere a importância no processo adaptativo, indicando a fixação no genoma através da pressão seletiva. Análises de seleção positiva no genoma identificaram genes submetidos a seleção, relevantes na interação com hospedeiro, mas não estão implicados no processo de adaptação em patogenias. Finalmente, a presença de ilhas genômicas e determinadas linhagens teriam um papel crucial na preferência por determinado hospedeiro e/ou doença. Análises genômicas e transcricionais poderão fornecer novas informações acerca do papel essencial de eventos de transferência horizontal e polimorfismos de nucleotídeo único envolvidos na diversificação e compreensão dos mecanismos de adaptação de P. multocida. Pasteurella multocida is a commensal and opportunistic pathogen that causes several diseases such as snuffles, pneumonia, atrophic rhinitis, fowl cholera and hemorrhagic septicemia in different hosts. These diseases cause a high rate of morbidity and mortality, causing important economic loss worldwide. In Peru, P. multocida is a mean agent of pneumonic infection, with a high mortality rate in neonatal alpacas in the seasons of icy. This represents a major problem since the production of alpacas is one of the main economic resources from the Andes region. In this context, knowledge of genomic characteristics from P. multocida species is essential for the development of future strategies for the control and prevention of these diseases. For this reason, the UNMSM strain isolated from an alpaca with pneumonia was sequenced and 22 P. multocida strains were retrieved from the NCBI database. In this case, to decipher the genetic diversity and adaptive process of P. multocida, this work aimed to perform phylogenomic and pan genomic analyses of isolates from distinct diseases and hosts. Analysis of positive selection, prediction of genomic islands and accessory genome were performed in the phenotype established phenotypic groups. As a result, the pathogenicity of the UNMSM strain was evidenced due to the presence of the main virulence genes of the species and the presence of pathogenicity islands. However, phylogenetic analysis has shown that the UNMSM strain diverges from other lineages in the pneumonia group. Analysis of the diversity based on the nucleotide/aminoacid phylogeny and presence and absence of genes show the agreement of the clustering of lineages from established phenotypic groups. Analysis of diversity by phylogeny based on the presence and absence of genes showed greater variability in the same group. Notably, the accessory genes encode proteins associated with metabolism and transport of carbohydrates, aminoacids, cell wall and membrane biogenesis, and hypothetical proteins. The presence of these functional groups as part of the accessory genome suggest the importance in the adaptation process, suggesting their fixation in the genome through selective pressure. Positive selection analysis identified genes under selection, relevant in host interaction but are not involved in the pathogen adaptation process. In conclusion, the presence of genomic islands and determinate strains would play a crucial role in host/disease predilection. Transcriptional and genomic analyzes may provide new information about the essential role of horizontal transfer events and single nucleotide polymorphisms involved in the diversification and understanding of the mechanisms of P. multocida adaptation.
- Published
- 2019
28. Estudio de la estructura poblacional de los géneros Escherichia y Shigella
- Author
-
Chacón Vargas, Lucía, Villanueva Cañas, José Luis, and Ventura Royo, Carles
- Subjects
filogenia ,Escherichia ,filogènia ,microbiología ,microbiology ,microbiologia ,comparative genomics ,phylogeny ,Genómica -- TFM ,Genomics -- TFM ,genòmica comparativa ,Shigella ,Genòmica -- TFM ,genómica comparativa - Abstract
Escherichia and Shigella have been deemed as two distinct bacterial genus. However, with the advances in microbiology it has been seen that they are strongly related. A study of the phylogenetic and pangenomic relationships of 14,078 sequences of Escherichia and 1,781 of Shigella has been carried out. Genomic and amino acid sequences from both genus were downloaded of the RefSeq database. Redundant genomic sequences were eliminated and the distance matrix was calculated with MASH. Shigella and Escherichia strains were classified according to the Clermont laboratory algorithm. The corresponding clusters were obtained by genus and by phylogenetic group with UMAP (in R) and with Gephi. Mmseqs2 was used for clustering protein sequences. The pangenome, coregenome and accessory genome were calculated and the corresponding graphs obtained in R. It could be observed very related clusters, suggesting the genomic proximity of both genus. Shigella strains classified as B1 phylogroup (more than 90 % of the total) were located in clusters very close to Escherichia phylogroup B1. The pangenome of both genus together and of each genus separately follows an open distribution. The size of the coregenome decreases as the number of genomes increases. By lowering the threshold to 95% of shared genes, the size of the coregenome remains virtually constant in about 3,000 genes. Escherichia y Shigella se han diferenciado como dos géneros distintos. Sin embargo, con los avances en microbiología se ha visto que están fuertemente relacionadas. En este trabajo se ha realizado un estudio de las relaciones filogenéticas y pangenómicas de 14.078 secuencias de Escherichia y 1.781 de Shigella. Se utilizaron secuencias genómicas y de aminoácidos de ambos géneros de la base de datos RefSeq. Se eliminaron las secuencias genómicas redundantes y se generó la matriz de distancias con MASH. Las cepas de Shigella y de Escherichia se clasificaron por filogrupos según el algoritmo del laboratorio de Clermont. Se crearon clústeres por género y por grupo filogenético con UMAP (en R) y con el software Gephi. Con Mmseqs2 se buscaron clústeres de las secuencias de aminoácidos. Se realizó el cálculo del pangenoma, coregenoma y genoma accesorio y se obtuvieron las gráficas correspondientes en R. Se observaron agrupaciones en UMAP muy relacionados entre sí, lo que indica la proximidad genómica de ambos géneros. Las cepas de Shigella clasificadas como filogrupo B1 (más del 90 % del total) se sitúan en agrupaciones muy cercanas al filogrupo B1 de Escherichia. El pangenoma de ambos géneros juntos y de cada uno por separado sigue una distribución abierta. El tamaño del coregenoma va disminuyendo según aumenta el número de genomas. Bajando el umbral a 85% o 95% de genes compartidos, el tamaño del coregenoma se mantiene prácticamente constante. Escherichia i Shigella s'han diferenciat com dos gèneres diferents. No obstant això, amb els avenços en microbiologia s'ha vist que estan fortament relacionades. En aquest treball s'ha realitzat un estudi de les relacions filogenètiques i pangenómicas de 14.078 seqüències d'Escherichia i 1.781 de Shigella. Es van utilitzar seqüències genòmiques i d'aminoàcids de tots dos gèneres de la base de dades RefSeq. Es van eliminar les seqüències genòmiques redundants i es va generar la matriu de distàncies amb MASH. Els ceps de Shigella i d'Escherichia es van classificar per filogrupos segons l'algoritme del laboratori de Clermont. Es van crear clústers per gènere i per grup filogenètic amb UMAP (en R) i amb el programari Gephi. Amb Mmseqs2 es van buscar clústers de les seqüències d'aminoàcids. Es va realitzar el càlcul del pangenoma, coregenoma i genoma accessori i es van obtenir les gràfiques corresponents a R. Es van observar agrupacions en UMAP molt relacionats entre si, el que indica la proximitat genòmica de tots dos gèneres. Els ceps de Shigella classificades com filogrupo B1 (més del 90% del total) se situen en agrupacions molt properes al filogrupo B1 d'Escherichia. El pangenoma de tots dos gèneres junts i de cada un per separat segueix una distribució oberta. La mida del coregenoma va disminuint segons augmenta el nombre de genomes. Baixant el llindar al 85% o 95% de gens compartits, la mida del coregenoma es manté pràcticament constant.
- Published
- 2019
29. Características genómicas dos principais microrganismos produtores de DNA polimerase: aplicação para PCR
- Author
-
Lourenço, Darling Andrade and Altino Choupina
- Subjects
Genómica funcional ,Genómica estrutural ,Termófilos ,Genómica comparativa - Abstract
O conjunto de enzimas denominadas DNA polimerases são responsáveis pela síntese e reparação de ácido desoxirribonucleico (DNA). Essa característica é muito útil para ensaios em biologia molecular nos quais há a necessidade de amplificar fragmentos de DNA, como na Reação em Cadeia da Polimerase (PCR). Na PCR, um fragmento de DNA delimitado por primers específicos é amplificado pela ação de DNA polimerase num processo com vários ciclos. Nos primeiros anos, a realização da técnica necessitava de grandes volumes dessa enzima, uma vez que a mesma não resistia as altas temperaturas. Após a descoberta das DNA polimerases em microrganismos termófilos e hipertermófilos, ou seja, resistentes à alta temperatura, a técnica de PCR foi refinada até chegar ao que é conhecido atualmente. Nesse sentido, o objetivo deste trabalho foi realizar pesquisas nas bases de dados de literatura científica PubMed e Science Direct e identificar os principais microrganismos produtores das DNA polimerases comercializadas atualmente. Foram escolhidos os seguintes microrganismos: Thermus aquaticus, Pyrococcus furiosus¸ Thermococcus litoralis e Thermotoga maritima. A partir da utilização do banco de dados de genoma do NCBI, as características de genómica estrutural e funcional de cada um são apresentadas, bem como a genómica comparativa entre os quatro microrganismos. As sequências de aminoácidos das DNA polimerases destes microrganismos foram alinhadas através da ferramenta ClustalW para caracterização filogenética. Apesar das diferenças evolutivas, as DNA polimerases apresentam a mesma atividade base em todos os organismos, variando apenas em características de acordo com a família à qual pertencem. No entanto, a DNA polimerase de Thermus aquaticus, Taq polimerase, é a mais utilizada devido ao seu custo/benefício ser melhor em comparação com as outras. The group of enzymes called DNA polymerases are responsible for the synthesis and repairment of deoxyribonucleic acid (DNA). This feature is useful for molecular biology assays in which there is a need to amplify DNA fragments, such as in the Polymerase Chain Reaction (PCR). In the PCR, a DNA fragment delimited by specific primers is amplified by the action of DNA polymerase in a process with several cycles. In the first years, to accomplish the amplification, a great amount of this enzyme was demanded since the ones used did not resist to the high temperatures. After the discovery of DNA polymerases in thermophilic and hyperthermophilic microorganisms, i. e., resistant to high temperature, the PCR technique was refined to how is known today. In line with this, this work aimed to identify, through research on PubMed and Science Direct databases, the major microorganisms that produce the DNA polymerases currently commercialized. The following microorganisms were chosen: Thermus aquaticus, Pyrococcus furiosus, Thermococcus litoralis and Thermotoga maritima. Using the genome database from NCBI, the genomics structural and functional characteristics of each one is presented., besides, the comparative genomics between the four microorganisms also is presented. The amino acid sequences of the DNA polymerases from these microorganisms were aligned with the ClustalW tool for phylogenetic characterization. Despite the evolutionary differences, DNA polymerases have the same essential activity in all organisms, diversifying only in characteristics according to the family in which these enzymes belong. Nevertheless, DNA polymerase from Thermus aquaticus, Taq polymerase, is still the most widely used due to its cost/benefit ratio that is better when compared to the others. info:eu-repo/semantics/publishedVersion
- Published
- 2019
30. Análisis comparativo de genes productores de piRNA en mamíferos
- Author
-
Montañés Domínguez, José Carlos, Ventura Royo, Carles, and Vavouri, Tanya
- Subjects
Bioinformática -- TFM ,Piwi-ARNs ,mineria de dades ,genòmica comparativa ,minería de datos ,comparative genomics ,data mining ,genómica comparativa ,Bioinformàtica -- TFM ,Bioinformatics -- TFM - Abstract
Los piRNAs son secuencias de RNA de 21-35 nucleótidos. Estas secuencias provienen de locus específicos conocidos con piRNA clústers (piCs). Los piRNAs son las encargadas de guiar a las proteínas de la familia PIWI a reprimir la expresión de los transposones (represión transcripcional) o bien de eliminar las secuencias nacientes de estos (represión post-transcripcional). Pese a que se ha comprobado la conservación de las proteínas de la familia PIWI, se sabe muy poco sobre la conservación tanto de los piRNAs como de los piCs. En este trabajo hemos estudiado la conservación de los piRNA producidos en genes codificantes y el contenido de regiones repetitivas en una serie de piC predichos en 10 mamíferos distintos. En primer lugar, hemos encontrado que la mayoría de piRNAs génicos se producen en intrones y exones. Seguidamente analizamos la conservación de los genes que producen piRNAs. Hemos obtenido que, a pesar de que la mayoría de los genes se conservan entre los distintos clades observados sólo una pequeña fracción de genes productores de piRNA se encuentran conservados. Finalmente hemos analizado cómo la densidad de repeticiones LTR en los piCs es mayor respecto a los genes y a la región solapada entre piCs y genes ortólogos productores de piRNA. Como conclusión del trabajo obtenemos que existen un número limitado de genes productores de piRNA que conserven esta función entre los diversos mamíferos estudiados. Sin embargo, estos genes conservados mantienen características similares entre ellos sugiriendo un mecanismo de creación distinto al resto de piCs. Els piRNAs són seqüències de RNA de 21-35 nucleòtids. Aquestes seqüències provenen de locus específics coneguts amb piRNAs clústers (piCs). Els piRNAs són els encarregats de guiar les proteïnes de la família PIWI a reprimir l'expressió dels transposons (repressió transcripcional) o bé d'eliminar les seqüències naixents d'aquests (repressió post-transcripcional). Malgrat que s'ha comprovat la conservació de les proteïnes de la família PIWI, se sap molt poc sobre la conservació tant dels piRNAs com dels pics. En aquest treball hem estudiat la conservació dels piRNAs produïts en gens codificats i el contingut de regions repetitives en una sèrie de piC en 10 mamífers diferents. En primer lloc, hem trobat que la majoria de piRNAs gènics es produeixen en introns i exons. Seguidament analitzem la conservació dels gens que produeixen piRNAs. Hem obtingut que, tot i que la majoria dels gens es conserven entre els diferents clades observats només una petita fracció de gens productors de piRNAs es troben conservats. Finalment hem analitzat com la densitat de repeticions LTR en els piCs és més gran pel que fa als gens i a la regió superposada entre piCs i gens ortòlegs productors de piRNAs. Com a conclusió del treball obtenim que hi ha un nombre limitat de gens productors de piRNA que conservin aquesta funció entre els diversos mamífers estudiats. No obstant això, aquests gens conservats mantenen característiques similars entre ells suggerint un mecanisme de creació diferent de la resta de piCs. PIWI-interacting RNAs (piRNAs) are 21-35 nucleotide long noncoding RNAs. This type of small RNAs are created in specific loci called piRNA clusters (piCs). The function of piRNAs is to repress the propagation of transposons over the genome. To defend the cell against transposons piRNAs guide PIWI proteins to transposons causing their repression (transcriptional repression) or cleaving the transcripts (post-transcriptional repression). Although PIWI proteins are conserved among different species piRNAs are not. In this project we studied the conservation of piRNA produced in protein-coding genes and their repeat content in a set of previously predicted piRNA clusters from 10 different mammals. First, we found that in all mammals, protein-coding genes produce piRNAs from both exons and introns. Second, we analyzed the conservation of those genes that generate piRNAs. Although most mammalian genes are conserved, only a small fraction produce piRNAs in more than one species. Nevertheless, we found a small number of deeply conserved piRNA producing protein coding genes. Last, we analysed repeats in piCs, genic piCs and protein-coding genes. We found that there is higher density of LTR repeats in piC when compared to other protein-coding genes and the intersection of piCs and orthologues piRNA generating genes. We conclude that production of piRNAs from protein-coding genes evolves fast, with notable exceptions, and that the difference in repeat content between genic and intergenic piCs suggests different functions or modes of evolution.
- Published
- 2019
31. Genetics and transcriptomics of adherent-invasive Escherichia coli (AIEC): new approaches to uncover molecular markers for its rapid identification
- Author
-
Camprubí Font, Carla, Martínez Medina, Margarita, Garcia-Gil, L. J., and Universitat de Girona. Departament de Biologia
- Subjects
Comparative genomics ,616.3 - Patologia de l'aparell digestiu. Odontologia ,Molecular markers ,616.3 ,Eubacterias ,Genòmica compartiva ,577 - Bioquímica. Biologia molecular. Biofísica ,Eubacteria ,Crohn's disease ,Malaltia de Crohn ,Escherichia coli ,Genómica comparativa ,Enfermedad de Crohn ,Marcadores moleculares ,Marcadors moleculars ,AIEC ,Eubacteris - Abstract
The adherent-invasive Escherichia coli (AIEC) pathotype could play a role in the course of Crohn’s disease. This is characterized by its capacity to adhere to and to invade intestinal epithelial cells as well as to replicate and survive within macrophages. At present, identification of the AIEC pathotype relies on time-consuming techniques based on the phenotypic screening of cultured bacteria, which are not standardized. In this thesis, we focused on the study of AIEC genetics in order to look for key characteristics that could assist the development of a molecular tool for the identification of the pathotype. To sum up, the results of this work provide meaningful information that contributes to our understanding of AIEC genomics. In this case, two putative molecular markers resulting from a combination of genetic and/or phenotypic features have been presented and these could assist in AIEC screening. Finally, gene expression results provide new insights to better describe genes putatively involved in AIEC virulence El patotip adherent-invasiu d’Escherichia coli (AIEC) podria jugar un paper en el transcurs de la malaltia de Crohn. Aquest es caracteritza per tenir capacitat d’adhesió i invasió a cèl·lules de l’epiteli intestinal a més de replicar-se i sobreviure en macròfags. Actualment la única manera d’identificar aquests bacteris és analitzant aquestes característiques fenotípiques, un mètode poc estandarditzat i que requereix molt temps i dedicació. En la present tesi ens hem centrat en estudiar genèticament el patotip AIEC per tal de buscar característiques clau que puguin ajudar en el desenvolupament d’una eina molecular per a la seva identificació. En resum, els resultats d'aquest treball proporcionen informació significativa que contribueix a la comprensió de la genètica del patotip AIEC. En aquest cas, s'han presentat dos possibles marcadors moleculars resultants d'una combinació de característiques genètiques i/o fenotípiques que podrien ajudar en la detecció d’AIEC. Finalment, els resultats d'expressió gènica proporcionen noves idees per descriure millor els gens implicats en la virulència del patotip AIEC Programa de Doctorat en Biologia Molecular, Biomedicina i Salut
- Published
- 2019
32. Biosynthesis of IAA in Pseudomonas savastanoi: a comparative genomic approach
- Author
-
Pintado Calvillo, Adrián, Murillo, Jesús, Rodríguez-Palenzuela, Pablo, and Ramos, Cayo
- Subjects
IAA ,Pseudomonas ,savastanoi ,food and beverages ,Genómica comparativa - Abstract
Bacteria belonging to the Pseudomonas syringae complex cause diseases in a variety of woody and herbaceous plants. Pseudomonas savastanoi is a member of this complex and produces tumors or excrescences in the aerial parts of woody plants. The species is classified into four pathovars, i.e. savastanoi (Psv, olive), nerii (Psn, oleander), retacarpa (Psr, Spanish broom) and fraxini (Psf, ash). Our research group have carried out the sequencing, annotation and comparative analysis of the genomes of several strains belonging to these pathovars. These analyses have identified the set of genes belonging to the P. savastanoi pan-genome and the collection of pathovar- and strain-specific genes. Through the web app PIFAR (Plant-bacterium Interaction Factors Resource) we have determined the presence of potential virulence factors involved in the interaction of these pathovars with their hosts. Special attention was given to genes putatively involved in the production of indole-3-acetic acid (IAA), a pathogenicity factor in these bacteria. With the exception of Psf, P. savastanoi strains produce IAA from tryptophan through the indole-3-acetamide pathway (iaaM and iaaH genes). We have shown that a Psv iaaMH mutant drastically reduces IAA levels. However, this mutant produces amounts of this phytohormone similar to those synthesized by Psf strains. We are currently analyzing the role of several Psv genes in the biosynthesis of IAA through alternative pathways. Universidad de Málaga. Campus de Excelencia Internacional Andalucía Tech.
- Published
- 2019
33. TIORREDOXINAS DE Eucalyptus grandis, DIVERSIDADE E EXPRESSÃO GÊNICA
- Author
-
Vitória Régia Alves Cavalcante, Fabiana Silva de Araújo, Diego Gomes Teixeira, and Paulo Marinho
- Subjects
Comparative genomics ,Genômica comparativa ,In silico ,Cellular homeostasis ,Forestry ,RNA-Seq ,Computational biology ,SD1-669.5 ,Biology ,Genome ,Gene expression ,RNA-seq ,Thioredoxin ,Tiorredoxinas ,Gene - Abstract
Tree genomes have been sequenced in recent years providing a source of basic information on multigenic family characterization. Comparative genomics based on those complete genome sequences available in public database is an important tool providing useful information to progress on functional gene characterization. In this work, we focus on gene encoding for Thioredoxins (Trxs) in Eucalyptus grandis genome, which are oxidoreductase enzymes, involved in significant biochemical processes, above all the maintenance of cellular homeostasis. Here we investigate the diversity, structure and expression of these genes in eucalyptus. For this purpose, bioinformatics tools were employed, using public platforms data, to identify coding sequences and validate gene expression. Specific softwares were employed to characterize gene structure and expression. RT-PCR assays were carried out to specifically verify the expression of 4 cytoplasmic thioredoxin genes, observed in silico from leaf, phloem, xylem and apical meristem tissues. Twenty-two Trxs with characteristic and canonic active sites were identified, confirming the presence of all types of the three main groups already defined as plastidial (m, f, x, y, z) cytoplasmatic (h) and mitochondrial (o). However, differences in the number of genes per group were observed when compared with other tree genomes. The expression of these thioredoxin genes compared to some homologous genes presented divergent expression patterns compared to Arabidopis thaliana suggesting a functional specificity in eucalyptus, such as in the case of Eucgr.F01604 gene encoding an h1 cytoplasmic Trx, which presents a strong expression in conductor tissues. RESUMO Genomas de árvores tem sido sequenciados nos últimos anos e constituem uma fonte de informação de base para o estudo de famílias multigências em genômica comparativa. Neste trabalho, o interesse se concentra nos genes que codificam Tiorredoxinas (Trxs) em Eucalyptus grandis, enzimas oxidoredutases envolvidas em significativos processos bioquímicos, sobretudo na manutenção da homeostase celular. Aqui se considera a diversidade, estrutura e expressão desses genes no eucalipto. Para tanto, ferramentas de bioinformática foram empregadas para identificar sequências codantes e validar dados. Programas específicos foram empregados para caracterizar a estrutura e expressão dos genes. Ensaios de RT-PCR foram realizados para 4 genes de tiorredoxinas citoplasmáticas a partir de tecidos de folha, floema, xilema e meristema apical para confirmar a expressão observada in silico. Foram identificadas 22 Trxs com sítio ativo característico confirmando a existência de todos os representantes dos três principais grupos já definidos em plantas, plastidiais (m, f, x, y, z) citoplasmáticas (h), e mitocondriais (o) no genoma do eucalipto. Observaram-se, no entanto, diferenças quanto ao número de genes por grupos em comparação com outros genomas de árvores. A expressão desses genes de tiorredoxina mostrou-se, para alguns genes homólogos, divergente do que fora observado em Arabidopis thaliana sugerindo uma especificidade de função em eucalipto a exemplo do gene Eucgr.F01604 que codifica uma Trx citoplasmática h1 e que apresenta forte expressão em tecidos condutores.
- Published
- 2019
- Full Text
- View/download PDF
34. Identification and analysis of copper resistance and homeostasis genes in a new copper-tolerant Alteromonas macleodii bacterial strain
- Author
-
Iturbide Martinez de Albeniz, Ane, Ventura Royo, Carles, and Erill Sagales, Ivan
- Subjects
Bioinformática -- TFM ,bacterias marinas ,marine bacteria ,genòmica comparativa ,comparative genomics ,genómica comparativa ,tolerancia Cooper ,bacteris marins ,Bioinformàtica -- TFM ,Copper tolerance ,tolerància Cooper ,Bioinformatics -- TFM - Abstract
The presented project shows a first approach to automatize the search of ortholog proteins and has analysed first obtained list of candidates generating interesting observations regarding copper-resistance systems representation in different bacterial strains. Both resistant strains of Alteromonas macleodii analyzed show higher number of copper-resistance related genes in their genome. The search for a conserved DNA sequence motif has given new insights into the transcriptional regulation mechanisms in Alteromonas macleodii species, which have been shown to be different from its Alteromonas counterparts. El proyecto presentado muestra una primera aproximación para automatizar la búsqueda de proteínas ortólogas. También se ha analizado la primera lista de candidatos obtenida resultando en observaciones sobre la representación de los sistemas de resistencia a cobre en diferentes cepas bacterianas. Las dos cepas resistentes de Alteromonas macleodii analizadas muestran un número mayor de genes relacionados con resistencia al cobre en su genoma. La búsqueda del motivo de secuencia de ADN conservado a dado lugar a nuevas perspectivas en los mecanismos de regulación transcripcional en la especie Alteromonas macleodii, el cual ha mostrado ser diferente de otras especies que también pertenecen a las Alteromonas. El projecte presentat mostra una primera aproximació per a automatitzar la cerca de proteïnes ortólogas. També s'ha analitzat la primera llista de candidats obtinguda resultant en observacions sobre la representació dels sistemes de resistència a coure en diferents ceps bacterians. Els dos ceps resistents de Alteromonas macleodii analitzades mostren un nombre major de gens relacionats amb resistència al coure en el seu genoma. La cerca del motiu de seqüència d'ADN conservat a donat lloc a noves perspectives en els mecanismes de regulació transcripcional en l'espècie Alteromonas macleodii, el qual ha mostrat ser diferent d'altres espècies que també pertanyen a les Alteromonas.
- Published
- 2019
35. Inference of the genes in the ancestor of amniotes and the genomic basis for the origin of the egg
- Author
-
Lavín Cabanas, María, Irisarri Aedo, Iker, and Universidad de Cantabria
- Subjects
Ganancia y pérdida de genes ,Evolution ,Comparative genomics ,Ontología de genes ,Amniota ,Homología ,Homology ,Evolución ,Huevo ,Amniote ,Egg ,Genómica comparativa ,Gene ontology ,Genomes ,Gene gain and loss ,Genomas - Abstract
Amniotes are the first fully terrestrial vertebrate animals with several evolutionary innovations in their common ancestor that allowed them to become fully independent of the aquatic environment, including a more complex egg with shell and additional structures. During evolution, organisms’ form and functions evolve, and so do their genomes, which are the ultimately responsible for the observed changes. In fact, genomes are evolutionarily labile and experience changes in gene content and structure. This Project aims to investigate the genomic basis for the origin of amniotes and their evolutionary innovations. From a bioinformatic point of view, this work involves: (i). choosing the highest quality vertebrate genomes to use in our analysis; (ii). estimating the genes that originated in the common ancestor of reptiles, birds and mammals by searching for sequence similarity and clustering of homologous genes; (iii). functionally characterizing the novel genes that originated in the common ancestor of amniotes and identifying any relationship with the origin of the amniote egg. RESUMEN: Los amniotas son los primeros animales vertebrados completamente terrestres con varias innovaciones evolutivas en su ancestro común que les permitió independizarse totalmente del entorno acuático, entre ellos un huevo más complejo con cáscara y estructuras adicionales. Durante la evolución, el aspecto y la función de los organismos evolucionan, al igual que sus genomas, que son los responsables de las transformaciones observadas. De hecho, los genomas están constantemente sometidos a cambios debido a la evolución y experimentan modificaciones en el contenido y la estructura de los genes. El objetivo principal de este proyecto es investigar la base genómica del origen de los amniotas y sus innovaciones evolutivas. Desde un punto de vista bioinformático, este trabajo implica: (i). seleccionar los genomas de vertebrados de mayor calidad para usarlos en nuestro análisis; (ii). Estimar los genes nuevos que se originaron en el ancestro común de reptiles, aves y mamíferos mediante la búsqueda de similitud de secuencias y agrupamiento de genes homólogos; (iii). caracterizar funcionalmente los genes inferidos como nuevos en el ancestro de los amniotas e identificar una posible relación con el origen del huevo amniota. Máster en Ciencia de Datos
- Published
- 2019
36. Streamlining minimal bacterial genomes : Analysis of the pan bacterial essential genome, and a novel strategy for random genome deletions in Mycoplasma pneumoniae
- Author
-
Shaw, Daniel, 1993, Serrano Pubull, Luis, 1982, Lluch-Senar, Maria 1982, and Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut
- Subjects
Essentiality ,Random deletions ,Esencialidad ,Deleción aleatoria ,Cre/Lox ,Comparative genomics ,Genoma mínimo ,Minimal genome ,Genómica comparativa ,Cre Lox - Abstract
Understanding what constitutes a true Minimal Cell is a key challenge in synthetic biology. In this work, we present two new tools to aid in this endeavour. i) A novel methodology for minimising the Mycoplasma pneumoniae genome via random deletions of genetic material. This protocol utilises the Cre Lox system coupled with random transposon mutagenesis to create a population with random lox sites dispersed around the genome. This allows for a population of cells containing a high variability of large and small-scale deletions ranging from 50bp to 25Kb within M. pneumoniae. ii) The first large scale analysis of the essentiality of genes from multiple bacterial species, and how the composition and function of the essential genome of a bacterium changes based on the genome’s complexity. Discernir cuales son los componentes que podrían constituir una célula mínima es un desafío clave para la Biología Sintética. En esta tesis, se presentan dos nuevas herramientas para facilitar esta tarea. (i) Una nueva metodología para minimizar el genoma de Mycoplasma pneumoniae mediante la deleción aleatoria de material genético. Esta técnica combina el sistema Cre/lox con la mutagénesis aleatoria mediada por transposones para generar poblaciones bacterianas en las que los sitios lox están distribuidos de manera aleatoria a lo largo de su genoma. Esto permite la generación de poblaciones bacterianas en las que el tamaño de las deleciones efectuadas varia desde 50 pb hasta 25 kb. (ii) El primer análisis a gran escala de la esencialidad genética en múltiples especies bacterianas, y cómo la composición y función del grupo de genes esenciales de una bacteria cambia en función de la complejidad de su genoma.
- Published
- 2019
37. Análise genômica comparativa de uma linhagem de Klebsiella pneumoniae multirresistente recentemente isolada de um paciente no Brasil
- Author
-
Rodrigo Profeta Silveira Santos, Vasco Ariston de Carvalho Azevedo, and Thiago Luiz de Paula Castro
- Subjects
Patógenos Multiresistentes ,Average Nucleotide Identity ,Genômica Comparativa ,Bioinformática ,Multilocus Sequence Type - Abstract
Klebsiella pneumoniae é uma bactéria Gram-negativa, sem motilidade, em forma de bastonete e encapsulada, que habita vários nichos ecológicos, variando do solo à água. É também um dos patógenos humanos mais importantes, emergindo como agente de graves infecções. Uma análise abrangente do genoma desse microrganismo tem o potencial de fornecer uma melhor compreensão das bases moleculares de sua virulência e patogênese, contribuindo para novas formas de controle da doença. Neste estudo, sequenciamos o genoma de uma linhagem de K. pneumoniae multirresistente, denominada B31, que foi isolada do lavado broncoalveolar de uma paciente admitida em uma unidade de terapia intensiva, no Brasil. As sequências de DNA obtidas da linhagem B31, a partir do sequenciamento Illumina, foram montadas usando uma abordagem ab initio, resultando em um cromossomo de 5,27 Mb. Um multireplicon (IncFIIk / IncFIBk), provavelmente pertencente a um plasmídeo conjugativo, e um replicon IncI1, que pertence a um segundo plasmídeo, foram encontrados usando a ferramenta PlasmidFinder. Comparações genômicas foram conduzidas entre a linhagem B31, outro isolado clínico do Brasil (Kp13), e outros 171 isolados clínicos cujas sequências completas foram recuperadas do banco de dados do NCBI. B31 foi encontrada como sendo pertencente ao Sequence type 15 (ST15), um dos 52 STs encontrados dentre as 173 linhagens analisadas. A busca por genes de resistência revelou que todas as linhagens selecionadas contêm pelo menos um gene codificante de beta-lactamase de espectro estreito (bla). Análises comparativas adicionais foram conduzidas com 44 linhagens representativas de K. pneumoniae, escolhidas com base em resultados filogenômicos e caracterização por MLST. A identificação dos genomas central e acessório foi realizada para caracterizar a conexão entre todas as linhagens analisadas. Este estudo fornece informações genômicas que podem ser úteis para auxiliar na identificação de novas drogas e no desenvolvimento de vacinas contra esse patógeno com implicações na saúde pública. Klebsiella pneumoniae is a Gram-negative, non-motile, rod-shaped, and encapsulated bacterium that dwells in various ecological niches, ranging from soil to water. It is also one of the most important human pathogens, emerging as an agent of severe community infections. A comprehensive analysis of the genome of this microorganism could provide a better understanding of the molecular basis of its virulence and pathogenesis, contributing to new forms of disease control. In this study, we sequenced the genome of a multidrug resistant K. pneumoniae strain, herein named B31, that was isolated from the bronchoalveolar lavage of a patient admitted to an intensive care unit, in Brazil. The DNA sequences obtained from strain B31, with the Illumina sequencing technology, were assembled to form a 5.27-Mb sized genome, using an ab initio approach. A plasmid multireplicon (IncFIIk/ IncFIBk), likely to belong to a conjugative plasmid, and a replicon IncI1, which belongs to a second plasmid, were found using the PlasmidFinder tool. Genomic comparisons were conducted among strain B31, another clinical isolate from Brazil (KP13), and other 171 clinical isolates whose complete genome sequences could be retrieved from the NCBI database. B31 was found to belong to the sequence type 15 (ST15), one out of the 52 sequence types (STs) characterizing the 173 strains analyzed. An in-silico screening of resistance genes revealed that all selected strains harbor at least one narrow-spectrum beta-lactamase (bla) gene. Further comparative analyses were conducted with, 44 representative K. pneumoniae strains, chosen based on phylogenomics and MLST results. The identification of the core and accessory genes was conducted to disclose the connection among all analyzed strains. This study provides genomic information that might be useful to aid in the design of new drugs and vaccines against a pathogen with public health implications.
- Published
- 2018
38. Análise genômica comparativa de linhagens de Staphylococcus aureus isoladas de diferentes formas de mastite em ovinos
- Author
-
Ana Carolina Barbosa Caetano, Thiago Luiz de Paula Castro, Vasco Ariston de Carvalho Azevedo, Núbia Seyffert, Aristóteles Góes Neto, and José Miguel Ortega
- Subjects
Genômica comparativa ,Genoma central ,Genômica ,Complexo clonal ,Mastite ,Biologia computacional ,Genoma ,Ovinos - Abstract
Staphylococcus aureus é o maior agente etiológico de mastite em pequenos ruminantes de todo o mundo. Mastite consiste em uma infecção na glândula mamária que é de difícil cura e possível reincidência, levando a grandes perdas econômicas na produção de leite e na criação de animais de rebanho. Pouco se sabe sobre características genômicas de linhagens de S. aureus isoladas de mastite em pequenos ruminantes, principalmente em ovinos. Estudos dos genomas desse microrganismo podem contribuir para melhor compreensão de traços envolvidos na especialização por hospedeiro e além disso, contribuir para novas estratégias de tratamento e controle da mastite ovina. Neste estudo, análises de genômica comparativa entre 12 linhagens isoladas de mastite de ovelhas da França e 11 genomas isolados de diferentes hospedeiros, disponíveis no banco de dados do NCBI, foram realizadas. Como resultado, 3,964 diferentes genes foram encontrados nos genomas e 2,969 genes são compartilhados entre eles, destes, 859 são genes acessórios. Os 2,110 genes que fazem parte do genoma central estão envolvidos no metabolismo celular, de acordo com as análises de distribuição de COG. Além disso, os grupos de genes acessórios e genes exclusivos encontrados nas linhagens de ovinos estão incluídos na categoria de sinalização celular. Profagos, ilhas de patogenicidade e ilhas genômicas foram preditas e carreiam importantes fatores de virulência bacteriano. Um agrupamento de linhagens ovinas pode ser observado na análise de Identidade Média de Nucleotídeos. Além disso, as análises de Tipagem de Sequências Multilocus revelaram dois grandes grupos clonais de S. aureus ovino, exceto por três linhagens que podem ser consideradas atípicas. Este resultado está de acordo com as análises filogenéticas. Em adição, algumas linhagens isoladas de ovelha e vaca podem estar evolutivamente relacionadas. Estas análises de genômica comparativa podem contribuir para a identificação dos genes adquiridos por transferência horizontal, bem como o papel destes na adaptação do hospedeiro e virulência bacteriana, e caracterização das linhagens que acometem ovinos. Staphylococcus aureus is the major etiological agent of mastitis in small ruminants, worldwide. Mastitis is a mammary gland inflammation that is difficult to cure and prone to resurgence, leading to great economical losses in milk production and herd animals. To date, little is known about the genomic features specific to S. aureus strains isolated from mastitis in small ruminants, such as ovines. The study of the genomes of these microorganisms might contribute to a better understanding of the bacterial traits involved in the host specialization, supporting the development of new treatment and control strategies for ovine mastitis. In this study, comparative genomic analyses between 12 strains isolated from ovine mastitis in France and 11 genomes, isolated from various hosts, retrieved from the NCBI database, were performed. Results revealed 3,964 different genes found in the genomes and 2,969 genes shared between the groups, out of these, 859 are accessory genes. The 2,110 genes, which comprise the core genome, are involved in the cellular metabolism, according to the COG distribution analysis. Beyond the cellular metabolism category, the groups of accessory genes and genes exclusively found in the ovine strains include the cell signaling category. Prophages, pathogenicity and genomic island were predicted and carries important bacterial virulence factors. A cluster of ovine strains was formed in the Average Nucleotide Identity analysis. Besides that, the Multilocus Sequence Typing analysis revealed two big clonal- related group of S. aureus ovine, except for three strains that can be considered atypical. This result is in agreement with the phylogenetic analysis. In addition, some sheep and cattle strains can be evolutionary related. These comparative genomic analyses may contribute to the identification of traits acquired through lateral gene transfer, as well as the roles of these traits in host adaptation and virulence, and characterization of S. aureus ovine strains.
- Published
- 2018
39. Characterization of lytic murein transglycosylases in xanthomonas citri subsp. citri 306 and functional study of Tnxax1 element lts mltb2.1 and mltb2.2
- Author
-
Oliveira, Amanda Carolina Paulino de [UNESP], Universidade Estadual Paulista (Unesp), and Varani, Alessandro de Mello [UNESP]
- Subjects
Genômica comparativa ,Transferencial lateral ,Virulência ,Virulence ,Comparative genomics ,Site-directed deletion mutagenesis ,Mutação sítio-dirigida ,Lateral gene transfer - Abstract
Submitted by Amanda Carolina Paulino de Oliveira (amanda@posgrad.fcav.unesp.br) on 2018-07-30T23:45:45Z No. of bitstreams: 1 Dissertação final - ACPO - Versão online.pdf: 8789441 bytes, checksum: a845ac98a1435e414423acdc29c30ff5 (MD5) Approved for entry into archive by Karina Gimenes Fernandes null (karinagi@fcav.unesp.br) on 2018-07-31T11:04:06Z (GMT) No. of bitstreams: 1 oliveira_acp_me_iabo.pdf: 8789441 bytes, checksum: a845ac98a1435e414423acdc29c30ff5 (MD5) Made available in DSpace on 2018-07-31T11:04:06Z (GMT). No. of bitstreams: 1 oliveira_acp_me_iabo.pdf: 8789441 bytes, checksum: a845ac98a1435e414423acdc29c30ff5 (MD5) Previous issue date: 2018-07-04 Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) Xanthomonas citri subsp. citri 306 (XccA) é o agente causal do cancro cítrico (CC), doença endêmica que afeta a citricultura. Durante a interação patógeno-hospedeiro o sistema de secreção tipo três (SST3) codificado pela XccA age na translocação de efetores e no estabelecimento da doença. A montagem do aparato de SST3 depende da síntese, remodelagem e degradação da parede celular bacteriana, sendo este processo realizado pela ação enzimática de transglicosilases líticas de mureína (LTs). XccA codifica diversas LTs, porém, pouco é conhecido sobre a diversidade de famílias e relação com a virulência. Dentre as LTs com provável relação com a virulência, duas ORFs parálogas presentes no cromossomo e plasmídeo pXAC64, respectivamente; são genes passageiros do TnXax1, um transposon da família Tn3, relacionado a evolução e emergência da patogenicidade nas Xanthomonadales. Portanto, este estudo objetivou elucidar o provável papel e diversidade das LTs presentes no genoma de XccA, caracterizando funcionalmente as LTs presentes em TnXax1 pela técnica de mutação sítio dirigida. Foram identificadas no genoma de XccA 13 LTs, sendo 12 pertencentes às famílias: 1A, 1B, 1C, 1D, 1F, 1G, 3A, 3B (2 cópias), 5A e 6A, e uma não classificada. A LT não classificada, é exclusiva do gênero Xanthomonas e relacionada à família 3B, porém contém um domínio adicional relacionado ao metabolismo de carboidratos. As LTs classificadas em famílias apresentam provável função relacionada com a remodelagem da parede celular para inserção de sistemas de secreção tipo 3, 4 e 6, inserção de flagelo, divisão celular, reciclagem da parede celular e degradação e controle da produção do peptidoglicano. As LTs do TnXax1 pertencem a família 3B, não são essenciais para XccA e desenvolvimento do CC, porém estão relacionadas ao aumento da virulência, diminuição da formação de biofilme, agregação e aumento na produção de goma xantana, corroborando o papel do TnXax1 como agente propagador da patogenicidade e virulência em Xanthomonadales. Em resumo, os resultados lançam novos conhecimentos frente ao papel das LTs com o metabolismo do peptidoglicano e relação com os mecanismos de transferência lateral, virulência e patogenicidade de XccA. Xanthomonas citri subsp. citri 306 (XccA) is a causal agent of type A citrus canker (CC), one of the most devastating citriculture diseases. Type 3 Secretion Systems (T3SS) play a fundamental role in XccA pathogenicity. T3SS components are embedded in the bacterial inner and outer membrane and act as a channel for injection of effector proteins directly into the plant host cell cytosol. T3SS assembly and installation relies on bacterial cell wall synthesis, remodeling and degradation. Murein lytic transglycosylases (LT) are important in this process and are responsible for peptidoglycan cleavage and its remodeling. Information about the XccA LT arsenal is scarce: little is known about family diversity, their exact role and their connection to virulence in this bacterium. Among the LTs with probable relation to virulence, two paralogue ORFs (one in chromosome, one in pXAC64 plasmid) are passenger genes of the Tn3 family transposon TnXax1, known to play a significant role for evolution and emergence of pathogenicity in Xanthomonadales. This study addresses LT diversity in the XccA genome and examines the role of plasmid and chromosomal TnXax1 LT passenger genes using site-directed deletion mutagenesis and functional characterization. We identified 13 XccA LTs: 12 belong to families 1A, 1B, 1C, 1D (2 copies), 1F, 1G, 3A, 3B (2 copies), 5A, 6A and one which is non-categorized. This noncategorized gene, is exclusive to the Xanthomonas genus and related to the 3B family but contains an additional domain linked to carbohydrate metabolism, whilst the other catalyzes peptidoglycan biosynthesis, and is widely distributed in gammaproteobacteria. The categorized LTs are probably involved in cell wall remodeling to allow insertion of type 3, 4 and 6 secretion systems, flagellum assembly, division and recycling of cell wall and degradation and control of peptidoglycan production. The TnXax1 passenger LTs (3B family) are not essential to XccA and CC development but are implicated in virulence, biofilm production and aggregation decrease and xanthan gum production increase, corroborating the role of TnXax1 transposon as a virulence and pathogenicity propagating agent in XccA. These findings also suggest that LTs acquisition by horizontal gene transfer mediated by TnXax1 improved bacterial fitness, bringing adaptive advantages to the plant-pathogen interaction process. 33004102070P6
- Published
- 2018
40. Caracterização de marcadores moleculares para diagnóstico e discriminação das quatro variantes de Xanthomonas que infectam citros
- Author
-
Fonseca, Natasha Peixoto, Moreira, Leandro Marcio, Moreira, Patrícia de Abreu, and Brommonschenkel, Sérgio Hermínio
- Subjects
Genômica comparativa ,Xanthomonas ,Diagnóstico molecular ,Bioinformática - Abstract
Programa de Pós-Graduação em Biotecnologia. Núcleo de Pesquisas em Ciências Biológicas, Pró-Reitoria de Pesquisa de Pós Graduação, Universidade Federal de Ouro Preto. A agricultura é um dos principais setores da economia brasileira com uma expressiva influência no crescimento do PIB brasileiro. Uma das commodities que mais contribui para este fato é a citricultura, uma vez que o Brasil ocupa o papel de maior produtor e exportador de citros do mundo. Entretanto, diversos fatores têm afetado a produtividade de citros, com destaque para os problemas fitossanitários que acometem essa atividade em todo país. Caracterizadas pela sua fácil disseminação, três espécies de Xanthomonas estão associadas com a geração de danos e consequentes perdas citrícolas: X. citri subsp. citri patotipo A (XccA), agente causal do Cancro Cítrico Asiático, X. fuscans subsp. aurantifolii variante B (XauB) e C (XauC) causadoras da Falsa Cancrose e da Cancrose C, respectivamente, e X. alfalfae subsp. citrumelonis (Xacm) causadora da Mancha Bacteriana dos Citros. Estes diferem quanto à virulência, patogenicidade e hospedeiros. Dessa forma, estudos que visem o desenvolvimento de tecnologias para a detecção, identificação e controle dessas diferentes espécies são de extrema importância. Assim, o objetivo desse estudo foi desenvolver um método de diagnóstico molecular a partir de sequências únicas identificadas por genômica comparativa que permitam a discriminação individual e múltipla das diferentes variantes de Xanthomonas que infectam Citrus. Para a identificação das sequências únicas, análises de ferramentas OrthoMCL, MAUVE, Primer Designing do NCBI e PCR in silico foram utilizadas para o desenho e validação inicial, considerando as diferenças nos tamanhos dos amplicons de modo a facilitar a análise visual do produto amplificado. As regiões alvo foram amplificadas por PCR e analisadas em gel de agarose 3%. Os resultados mostraram que os marcadores moleculares foram específicos aos genomas alvo in silico, in vitro e in vivo, sem qualquer amplificação cruzada nos outros genomas de referência, o que foi reiterado pelos resultados de PCR multiplex. A sensibilidade de detecção foi de até 0,02ng/μL nos testes in vitro e até 1,5 x 104 UFC mL-1 nos teste in vivo. Todos os resultados encontrados não apenas evidenciaram a possibilidade de diagnóstico por diferenciação das distintas variantes de Xanthomonas causadora de doenças em citros por meio de PCR como validaram a ferramenta computacional desenvolvida para este fim. Agriculture is one of the main sectors of the Brazilian economy with a significant influence in the growth of the Brazilian GDP. One of the commodities that contributes most to this fact is citriculture, whereas Brazil occupies the largest citrus producer and exporter in the world. However, several factors have affected citrus productivity, with emphasis on phytosanitary problems that affect this activity throughout country. Three species of Xanthomonas are associated with the generation of damages and consequent citrus losses: X. citri subsp. citri pathotype A (XccA), causative agent of Asian Citrus Cancer, X. fuscans subsp. aurantifolii pathotype B (XauB) and C (XauC) causative of False Citrus Canker and Cancrose C, respectively, and X. alfalfae subsp. citrumelonis (Xacm) causing Citrus Bacterial Spot disease. These species differ in virulence, pathogenicity and host. Therefore, studies aimed at the development of technologies for the detection, identification, and control of these different species are extremely important. Thus, the aim of this study was to develop a molecular diagnostic method from unique sequences identified by comparative genomics that allow the individual and multiple discrimination of the different Xanthomonas variants that infect Citrus. For the identification of unique sequences, analyzes of OrthoMCL, MAUVE, Primer Designing of the NCBI and PCR in silico were used for the design and initial validation, considering the differences in the sizes of the amplicons in order to facilitate the visual analysis of the amplified product. The target regions were amplified by PCR and analyzed on 3% agarose gel. The results showed that the molecular markers were specific to the target genomes in silico, in vitro, and in vivo without any cross-amplification in the other reference genomes, which was reiterated by multiplex PCR results. The detection sensitivity was up from to 0.02ng/μL in the in vitro tests and up to 1.5 x 104 UFC mL-1 in vivo assays. All the results not only highlighted the first empirical diagnostic tool for different variants of Xanthomonas that causes disease in citrus, but also validated the computational tool developed for this purpose.
- Published
- 2018
41. Population genomics of the emerging yeast pathogen Candida glabrata
- Author
-
Carreté Muñoz, Laia, 1990, Gabaldón Estevan, Juan Antonio, 1973, and Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut
- Subjects
Genòmica comparativa ,Human fungal pathogen ,Candida glabrata ,Fongs patògens ,Evolution recombination ,Evolució ,Population genomics ,Genòmica de poblacions - Abstract
Infections caused by pathogenic fungi are becoming an increasingly serious threat for human health. Pathogenic fungi such as Candida glabrata or Candida albicans, belong to phylogenetically distinct clades and have non-pathogenic close relatives, indicating that the ability to infect humans has evolved several times independently. Despite the many recent advances in biomedicine, we are still lacking an understanding of how virulence evolves across organisms and which mechanisms are involved in the emergence of pathogenesis. Elucidating how human pathogens evolve is of central relevance to understand the bases of virulence and spread of infectious agents. In this context, population genomics provides a powerful tool to uncover recent selection pressures that can shed light on how pathogens adapt to humans. We here evaluated genomic and phenotypic variation across 57 C. glabrata strains. Firstly, we focused on 33 globally-distributed isolates. We catalogued extensive copy number variation, which we found to particularly affect genes encoding cell-wall associated proteins, including adhesins. This variation is structured into seven deeply divergent clades, which show recent geographical dispersion and large within-clade genomic and phenotypic differences. We show compelling evidence of recent admixture between differentiated lineages, and of purifying selection on mating genes, which provide first evidence for the existence of an active sexual (or parasexual) cycle in this yeast. Altogether, our results point to a recent global spread of previously genetically isolated populations and suggest that humans are only a secondary niche for this yeast. Secondly, we analyzed the genomic variability of C. glabrata in pairs of serial isolates, each from the same patient. We detected that patients can host clonal and non-clonal isolates. We observed an active standing genetic diversity with recurrent recombination leading to significant differences in terms of oxidative stress resistance biofilm formation. These results suggested that standing genetic variation and withinhost recombination between divergent strains may play an important role in disease progression and treatment outcome., Infeccions causades per fongs patògens estan esdevenint un greu problema per la salut en humans. La candidiasis, una de les infeccions fungiques més comunes, està provocada principalment per patògens com Candida glabrata o Candida albicans. Aquestes dos especies són filogeneticament distants i tenen altres fongs no patògens al seu voltant, indicant que l’habilitat d’infectar humans ha evolucionat independentment durant els ultims anys. Malgrat els avanços en biomedicina, encara estem lluny d’entendre com la virulencia ha evolucionat en diferents organismes i quins mecanismes principals han actuat en l’emergència d’aquesta patogenicitat. Entendre com actuen els patogens és de principal importància per entendre les bases de la virulencia i expansió d’agents infecciosos. En aquest context, la genòmica de poblacions ens dóna una eina molt valuosa per investigar com la selecció ha actuat en aquests organismes i entendre com els patogens s’han adaptat als humans. Durant aquest projecte de Tesi, s’ha avaluat genomicament i fenotípicament 57 soques de C. glabrata. Primer, ens hem centrat en l’estudi de la variació genòmica de la població de C. glabrata utilitzant 33 soques distribuïdes arreu del mon. S’ha catalogat un gran nombre de delecions, duplicacions i aneuploïdies, les quals estan particularment enriquides en proteïnes de membrana o adhesines. Aquesta variació està estructurada en set clades diferents, els quals mostren una recent dispersió geogràfica i una elevada diferència genòmica i fenotípica dins dels clades. L’evidencia d’una recent barreja genètica entre diferents clades, i la presencia de selecció purificadora en gens relacionats en l’aparellament sexual, proporciona la primera evidencia de l’existencia d’un cicle sexual actiu en C. glabrata. També, s’ha analitzat els canvis genetics de C. glabrata en una serie de mostres aïllades en diferents dies d’un mateix pacient amb candidiasis. S’ha detectat que els pacients poden tenir soques clonals i soques no clonals. S’ha observat una variació genética existent i una recombinació recurrent que condueix a diferencies significatives en la formació de biofilms. Aquests resultats suggereixen que la variacio genética i la recombimnció dins de l’hoste provoca un paper important durant el progrés de la infecció i en el seu futur tractament.
- Published
- 2018
42. Estrategia computacional para detección y caracterización de bloques microsíntenicos relacionados a regiones genómicas asociadas a domesticación en frijol Lima
- Author
-
Garcia Navarrete, Leidy Tatiana and Chacón Sanchez, Maria Isabel
- Subjects
63 Agricultura y tecnologías relacionadas / Agriculture ,Phaseolus ,62 Ingeniería y operaciones afines / Engineering ,Ensamblaje genómico de novo ,Comparative genomics ,Genómica comparativa ,58 Plantas / Plants ,De novo genome assembly - Abstract
El frijol Lima (Phaseolus lunatus L.) es la segunda especie domesticada más importante del género Phaseolus y es de interés desde el punto de vista agronómico y ecológico por el amplio rango de adaptaciones agro-ecológicas que presenta. A pesar de esto, la carencia de recursos genómicos en frijol Lima ha sido uno de los mayores obstáculos para maximizar su potencial como cultivo o como fuente de rasgos de interés agronómico. En las leguminosas cultivadas, la dehiscencia de la vaina previo a la cosecha es indeseable puesto que causa grandes pérdidas en el rendimiento, por lo tanto, el conocimiento de los genes que controlan éste y otros rasgos importantes puede favorecer futuros programas de mejoramiento en esta especie. Para dar respuesta a esta necesidad, en el presente estudio se secuenció el genoma de una variedad domesticada de frijol Lima de Colombia con una combinación de plataformas de secuenciación (Illumina, PacBio y 10X-Genomics). El secuenciamiento produjo un total de 97.6 Gb de datos crudos, que después del filtrado y control de calidad generaron 61.9 Gb (103x de profundidad) que se usaron para el ensamblaje. Se obtuvo un ensamblaje genómico con una longitud de 541 Mpb, contenidos en 496 contigs, con un N50 de 5.5 Mpb. La longitud del ensamblaje representó el 90 % del tamaño estimado del genoma. Para la anotación funcional de este ensamblaje, se secuenciaron y ensamblaron los transcriptomas de tres tejidos vegetales (flor, hoja y vaina) que permitieron la identificación de 48.127 genes. Finalmente, el ensamblaje genómico se usó en un enfoque de genómica comparativa que detectó regiones microsinténicas entre frijol Lima, frijol común y frijol mungo. Esta estrategia permitió la identificación en frijol Lima de genes candidatos asociados a la dehiscencia de la vaina. Los resultados de la presente investigación son un avance significativo en la generación de recursos genómicos en frijol Lima que permitirán a la comunidad cientı́fica avanzar no solo en el estudio y mejoramiento genético de esta especie, sino también en un mayor entendimiento de la evolución de los cultivos de leguminosas en general. Abstract: Lima bean (Phaseolus lunatus L.) is the second most important domesticated species of the genus Phaseolus and its wide range of agro-ecological adaptations makes it a species of scientific interest for agronomic and ecological research. In spite of this, the lack of genomic resources in Lima bean has been one of the major hurdles to maximize its potential as a crop or as a source of traits of agronomic interest. In crop legumes, pod dehiscence prior to harvest is an undesirable trait associated to yield loss, therefore knowledge of genes that control this and other important traits may favor future breeding programs. To address this urgent need, in this study the genome of a Colombian domesticated variety of Lima bean was sequenced using a combination of platforms (Illumina, PacBio and 10X-Genomics). We generated about 97.6 Gb of raw sequencing data that after cleaning and filtering yielded a total of 61.9 Gb (103x depth) that were used for assembly. A genomic assembly was obtained with a total length of 541 Mbp, contained in 496 contigs, and an N50 of 5.5 Mbp. This genomic assembly was around 90 % of estimated genome size. To annotate this assembly, transcriptome data were obtained from three tissues (flower, leaf and pod) and used to identify 48.127 genes. Finally, the genome assembly was used in a comparative genomics framework to detect microsynthenic regions between Lima bean, common bean and mungo bean that contained candidate genes associated to pod dehiscence. Present results are a significant progress in the development of genomic resources in Lima bean, which will benefit not only the scientific community interested in the genetic improvement of this species but also researchers interested in understanding legume evolution in general. Maestría
- Published
- 2018
43. Comparative genomics of Saccharomyces cerevisiae ethanol-producing strains
- Author
-
Mirta Natalia Coutouné, Oliveira, Juliana Velasco de Castro, 1979, Brandão, Marcelo Mendes, Gross, Jefferson, Universidade Estadual de Campinas. Instituto de Biologia, Programa de Pós-Graduação em Genética e Biologia Molecular, and UNIVERSIDADE ESTADUAL DE CAMPINAS
- Subjects
Etanol - Produção ,Genômica comparativa ,Ethanol production ,Comparative genomics ,Strains ,Saccharomyces cerevisiae ,Cepas - Abstract
Orientador: Juliana Velasco de Castro Oliveira Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia Resumo: As crescentes mudanças na matriz energética mundial vêm sendo discutidas mundialmente e apontam o aquecimento global como o principal causador das mudanças climáticas. Existe um consenso de que uma das formas de diminuir este fenômeno é a substituição do uso de combustíveis fósseis por biocombustíveis, como o etanol. Atualmente, o etanol é obtido a partir da fermentação dos açúcares extraídos principalmente da cana-de-açúcar (Brasil) e do milho (EUA), sendo de fundamental importância entender os gargalos na produção deste biocombustível nas destilarias brasileiras para melhorar a produtividade do setor. Entre os desafios biotecnológicos mais importantes a serem superados pode-se citar a seleção e melhoramento de cepas de leveduras capazes de resistir às condições estressantes do processo fermentativo, como por exemplo, o estresse osmótico, altas concentrações de etanol e temperatura, entre outros. Assim, o presente trabalho pretende contribuir aumentando o conhecimento, a nível genômico, das cepas produtoras de etanol, visando associar as características fenotípicas desejáveis a genes de interesse nestas cepas industriais, através de análises de genômica comparativa. Para isso, neste trabalho foi realizado o sequenciamento da cepa Barra Grande (BG-1) e foram selecionadas 14 cepas industriais, proveniente de bancos de dados públicos, para realizar as análises comparativas. O sequenciamento e montagem da cepa BG-1 apresentou uma boa qualidade, com tamanho de cerca de 12 Mbp, conteúdo GC de 38,5%, com uma completeza genômica de 98%, onde possíveis rearranjos cromossômicos foram verificados. Em relação a genômica comparativa, as análises filogenômicas mostraram que algumas cepas se agrupam em ramos de acordo com a origem geográfica, como já reportado na literatura, mas que outras se agrupam segundo o tipo de biomassa fermentada. Neste sentido, as cepas laboratoriais, por terem uma origem americana, se agrupam próximo às brasileiras, em um ramo distante das industriais europeias e asiáticas. A busca de SNPs revelou que a diversidade e quantidade de polimorfismos não sinônimos nas cepas industriais é muito elevado em relação à cepa de referência, S288C. A anotação desses SNPs mostrou que os processos que se encontram mais representados são os de sinalização e transporte celular. As análises de aumento de número de cópias gênica apontam para vários genes envolvidos em aumento de tolerância aos processos industriais. A avaliação dos genes com evidência de seleção positiva revelou que existem alterações em regiões importantes para a funcionalidade de proteínas relevantes durante estresse celular. Por fim, análises do genoma mitocondrial mostraram que três cepas brasileiras apresentaram genoma reduzido, com ausência de regiões intergênicas. Neste trabalho foram identificados potenciais genes que poderiam contribuir com o fenótipo das cepas industriais brasileiras, as quais apresentam um bom desempenho fermentativo mesmo sob as condições do processo de produção de etanol. Apesar de seu caráter exploratório, futuras avaliações em laboratório deverão ser feitas para validar estes candidatos, visando o desenvolvimento de cepas mais robustas Abstract: The ongoing changes in the world energy matrix have been repeatedly discussed in the United Nations meetings, addressing the global warming as the main cause of climate change. There is a consensus that one way of contributing to the reduction of the phenomenon is the gasoline substitution for biofuels, such as ethanol. Currently, ethanol is obtained from the fermentation of sugars extracted mainly from sugarcane (Brazil) and corn (USA), two crops that are also used as food. Thus, it is of fundamental importance to understand the bottlenecks in the production of first and second generation ethanol (1G and 2G) in the Brazilian distilleries to improve the productivity of the sector. Among the most important biotechnology challenges to be overcome is the selection and improvement of yeast strains capable to resist the stressing conditions of the fermentation process. Among them, can mentioned the tolerance to high temperatures, high sugar and ethanol concentration, inhibitors such as weak acids and leached metals. In order to be able to associate these desirable phenotypic trait to genes of interest in tolerant strains, one of the objectives of this work was to use comparative genomic analyzes, which helped in comparing the complete genomes of different strains. For this, 14 industrial strains were selected from public databases, to perform comparative genomic analyzes, including a strain sequenced, assembled and annotated in the present study, the yeast Barra Grande 1 (BG-1). Sequencing and assembly of the BG-1 strain showed a good quality with a size of ~12 Mbp, GC content of 38.5%, a genomic completeness of 98%, where possible chromosomal rearrangements were verified. The phylogenomic analysis showed that some strains are grouped in branches according to the geographical origin, as reported in the literature, but others are grouped according to the type of fermented biomass. In this way, the laboratory strains, because they have an American origin, are grouped next to the Brazilian ones, in a branch far from the European and Asian industrialists. The search for SNPs revealed that the diversity and amount of non-synonymous polymorphisms in industrial strains is very high relative to the reference strain, S288C. The annotation of these SNPs showed that the processes that are most represented are those of signaling and cellular transport. Gene copy number analyzes point to several genes involved in increased tolerance to industrial processes. The evaluation of genes with evidence of positive selection revealed that there are alterations in regions important for the functionality of relevant proteins during cell stress. Finally, analyzes of the mitochondrial genome showed that three Brazilian strains presented reduced genome, with absence of intergenic regions. In this work, we identified potential genes that could contribute to the phenotype of the Brazilian industrial strains, which present a good fermentation performance even under the conditions of the ethanol production process. Despite its exploratory character, future laboratory evaluations should be done to validate these candidates, aiming the development of more robust strains Mestrado Microbiologia Mestra em Genética e Biologia Molecular CAPES FAPESP 2017/02124-0
- Published
- 2018
44. Diversidade da família gênica LEA nas espécies irmãs Setaria italica e Setaria viridis
- Author
-
Marchi, Larissa Batista Seixas de, Costa, Nathalia de Setta, Teodorov, Elizabeth, and Simões, Ana Carolina Quirino
- Subjects
LEA PROTEINS ,PHYLOGENY ,PROGRAMA DE PÓS-GRADUAÇÃO EM BIOTECNOCIÊNCIA - UFABC ,GENOME-WIDE ,FILOGENIA ,WATER STRESS ,ESTRESSE HÍDRICO ,PROTEÍNAS LEA ,POACEAE ,GENÔMICA COMPARATIVA - Abstract
Orientadora: Profª. Drª. Nathalia de Setta Costa Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Biotecnociência, São Bernado do Campo, 2018. A seca é um fenômeno natural, que provoca um grave desequilíbrio hídrico e afeta negativamente o meio urbano e rural. Para as plantas, a seca se apresenta como um tipo de estresse abiótico que afeta a morfologia e fisiologia, levando a reduções na produtividade, desenvolvimento e reprodução. Sabe-se que as proteínas LEA (do Inglês, Late Embryogenesis Abundant) desempenham papéis importantes na tolerância à seca nas plantas, porém pouco se sabe sobre elas nas especies irmãs Setaria italica e Setaria viridis, que têm se mostrado modelos adequados para estudos de tolerância ao estresse abiótico e da fotossíntese C4 em Poaceae. O objetivo deste trabalho foi caracterizar comparativamente a superfamília LEA nas espécies S. italica e S. viridis, para ampliar os conhecimentos sobre sua diversidade, estrutura e evolução. Foram encontrados 111 genes que codificam proteínas LEAs em ambas as espécies. Os genes foram classificados nas famílias LEA de acordo com a descrição de seus domínios PFAM, dessa forma pudemos propor que S. italica e S. viridis possuem genes de oito famílias: LEA_1, LEA_2, LEA_3, LEA_4, LEA_5, LEA_6, dehydrin e SMP, das nove que já haviam sido identificadas. Além disso, identificamos um grupo de genes com o domínio PFAM DUF4149, específico dessas espécies, denominado STA. A análise do pI e do GRAVY mostrou que cerca de 70% das proteínas LEA apresentam caráter básico e hidrofóbicas, respectivamente. Na análise de domínios proteicos, estrutura gênica e relações de ortologia dos genes, pudemos ver que ambas as espécies apresentam conservação dos domínios e que grande parte dos genes foram originados de duplicações in tandem assim como em outras espécies já analisadas. Com a predição dos sítios de direcionamento subcelular, localizamos na S. italica, 17 proteínas de cloroplasto e 33 de núcleo. Em S. viridis, 16 proteínas foram classificadas como estando presentes no cloroplasto, 23 presentes no núcleo e sete seriam secretadas. Destacamos que todos as proteínas das famílias: LEA_1, LEA_5 e LEA_6, tem o seu direcionamento subcelular para o núcleo, enquanto que para as demais famílias houve discrepância para a localização. Nas análises filogenéticas, em todas as árvores houve um agrupamento claro dos pares de genes ortólogos de S. italica e S. viridis. Em conclusão, as proteínas LEA de S. italica e S. viridis apresentam grande diversidade e o conhecimento adquirido neste trabalho fornecerá subsídios para futuros estudos de caráter funcional. Drought is a natural phenomenon, which causes a serious water imbalance and negatively affects the urban and rural environment. For plants, drought is a type of abiotic stress that affects morphology and physiology, leading to reductions in productivity, development and reproduction. The LEA (Late Embryogenesis Abundant) proteins play important roles in plant drought tolerance, but little is known about them in the sister species Setaria italica and Setaria viridis, which have been shown to be adequate models for studies on the tolerance to abiotic stress and C4 photosynthesis in Poaceae. The main goal of this study was to characterize the LEA superfamily in the species S. italica and S. viridis, to increase the knowledge about its diversity, structure and evolution. We identified 111 genes encoding LEA proteins in both species. The genes were classified in the LEA families according to the description of their PFAM domains, so we proposed that S. italica and S. viridis have genes from eight families of the nine that had already been identified: LEA_1, LEA_2, LEA_3, LEA_4, LEA_5, LEA_6, dehydrin and SMP. In addition, we identified a group of genes with the domain PFAM DUF4149, specific of these species, called hereafter STA. Analysis of pI and GRAVY showed that about 70% of the LEA proteins are basic and hydrophobic, respectively. In the analysis of protein domains, gene structure and synteny relationships of the genes, we showed that both species have conserved protein domains and that a great part of the genes originated from in tandem duplications, as well as, in other plant species already analyzed. The prediction of subcellular localization showed that S. italica have 17 LEA proteins direct to the chloroplast and 33 to the nucleus. In S. viridis, 16 proteins are directed to the chloroplast, 23 to the nucleus and seven are secreted. We highlight that all the proteins of the families LEA_1, LEA_5 and LEA_6, have their subcellular targeting to the nucleus, whereas for the other families there was a discrepancy of results. All the phylogenetic trees showed a clear grouping of the pairs of orthologous genes of S. italica and S. viridis. In conclusion, the LEA proteins of S. italica and S. viridis have great diversity and the knowledge accumulated in this work will support further functional studies.
- Published
- 2018
45. Análises de genomas de Bacillus thuringiensis subsp. israelensis isolados em Tocantins com toxicidade para mosquitos de interesse em saúde pública
- Author
-
Alves, Giselly Batista, Aguiar, Raimundo Wagner de Souza, and Melo, Fernando Lucas de
- Subjects
Genômica comparativa ,δ-endotoxinas ,Factors of virulence ,Fatores de virulência ,ENGENHARIAS::ENGENHARIA QUIMICA::TECNOLOGIA QUIMICA [CNPQ] ,Comparative genomics ,δ-endotoxins ,pBtoxis - Abstract
Bacillus thuringiensis subsp. israelensis é uma bactéria gram positiva, amplamente utilizada no controle de insetos Diptera, família Culicidae, tais como Aedes aegypti e Culex quinquefasciatus. O sequenciamento de genomas completos de estirpes de B. thuringiensis tem permitido a identificação e caracterização de proteínas inseticidas, assim como a realização de estudos de genômica comparativa, permitindo evidenciar diferenças funcionais e filogenéticas. Neste contexto, o presente estudo teve como objetivo realizar análises genômicas de quatro isolados de B. thuringiensis subsp. israelensis que apresentam diferentes toxicidades para larvas de A. aegypti e C. quinquefasciatus. O sequenciamento dos genomas dos isolados T0124, T0131, T0137 e T0139 foi realizado a partir da plataforma MiSeq-Ilumina, e a montagem e anotação foram feitas utilizando ferramentas do programa de bioinformática Geneious. As análises resultaram em cromossomos com tamanhos aproximados de 5.414 Kb, conteúdo G+C de 35,2% e 5.358 regiões codificantes. Com relação ao conteúdo extracromossomal, foram montados três plasmídeos menores de 5,4; 6,8 e 7,6 Kb, e três plasmídeos maiores de 127, 235 e 359 Kb para todos os isolados, e estes foram enumerados de 1 a 6. A anotação revelou que apenas os plasmídeos de número 4, que correspondem ao pBtoxis, possuem proteínas inseticidas, sendo elas Cry4Aa, Cry4Ba, Cry11Aa, Cry10Aa, Cyt1Aa, Cyt2Ba e Cyt1Ca. A análise comparativa entre os genomas demonstra que os cromossomos T0124, T0131, T0137 e T0139 apresentam sequências colineares e com 99% de identidade, e seus respectivos plasmídeos 1, 2, 3, 4, 5 e 6 compartilham todas as suas regiões codificantes, incluindo aquelas relacionadas a δ-endotoxinas. A comparação de sequências de enterotoxinas, metaloproteases e fosfolipases demonstra que estes também são conservados entre os genomas. Na análise filogenética, os cromossomos T0124, T0131, T0137 eT0139 agruparam-se juntamente com os genomas dos isolados AM65-52 e HD-789 disponíveis no GenBank, sugerindo uma estreita relação genética entre estirpes de B. thuringiensis subsp. israelensis. Os isolados T0124, T0131, T0137 e T0139 apresentam diferentes concentrações letais para larvas de A. aegypti e C. quinquefasciatus, e a adição de dados proteômicos aos dados genômicos, aqui obtidos, poderão auxiliar na compreensão destas diferenças de toxicidade. Contudo as análises comparativas entre os genomas dos isolados T0124, T0131, T0137 e T0139 mostram alto grau de conservação genética a nível de nucleotídeos de B. thuringiensis subsp. israelensis. Bacillus thuringiensis subsp. israelensis is a gram-positive bacterium widely used to control insects of the order Diptera, such as Aedes aegypti (Diptera: Culicidae) and Culex quinquefasciatus (Diptera: Culicidae). The sequencing of complete genomes of B. thuringiensis strains has allowed the identification and characterization of insecticidal proteins, as well as the comparative genomic studies, allowing the identification of functional and phylogenetic differences. In this context, the present study aimed to perform genomic analysis of four isolates of B. thuringiensis subsp. israelensis having different toxicities for larvae of A. aegypti and C. quinquefasciatus larvae. Sequencing of genomes of the isolates T0124, T0131, T0137 and T0139 was performed from the MiSeq-Ilumina platform, and assembly and annotation were done using tools from the Geneious bioinformatics program. The analyzes resulted in chromosomes with approximate sizes of 5,414 Kb, G + C content of 35.2% and 5,358 coding regions. Regarding extrachromosomal content, three smaller plasmids of 5.4, 6.8 and 7.6 Kb, and three larger plasmids of 127, 235 and 359 Kb were assembled for all the isolates, and these were enumerated from 1 to 6. The annotation revealed that only the plasmids of number 4, corresponding to pBtoxis, possess insecticidal proteins, being Cry4Aa, Cry4Ba, Cry11Aa, Cry10Aa, Cyt1Aa, Cyt2Ba and Cyt1Ca. Comparative analysis between the genomes demonstrates that chromosomes T0124, T0131, T0137 and T0139 have collinear sequences and 99% identity, and their respective plasmids 1, 2, 3, 4, 5 and 6 share all of their coding regions, including those related to δ-endotoxins. Comparison of enterotoxin, metalloprotease and phospholipase sequences shows that these are conserved among the genomes. In the phylogenetic analysis, chromosomes T0124, T0131, T0137 and T0139 were grouped together with the genomes of the isolates AM65-52 and HD-789 available in GenBank, suggesting a close genetic relation between strains of B. thuringiensis subsp. israelensis. The isolates T0124, T0131, T0137 and T0139 present different lethal concentrations to larvae of A. aegypti and C. quinquefasciatus, and the addition of proteomic data to the genomic data obtained here may help to understand these differences in toxicity. However, the comparative analyzes between the genomes of isolates T0124, T0131, T0137 and T0139 show a high degree of genetic conservation at the nucleotide level of B. thuringiensis subsp. israelensis.
- Published
- 2017
46. Inferências genômicas e filogenéticas dos genomas acessórios das Polytrichaceae Antárticas: Polytrichum strictum Menzies ex Brid. e Polytrichum juniperinum Hedw
- Author
-
Freitas, Karine Elise Janner de, Victoria, Filipe de Carvalho, Silva, Micheline Carvalho, Câmara, Paulo, and Oliveira, Antônio Costa de
- Subjects
CIENCIAS BIOLOGICAS [CNPQ] ,Genômica comparativa ,Antártica ,Polytrichum ,DNA ,Genomas - Abstract
A família das Polytrichaceae possui diversos representantes no continente Antártico, e entre elas a espécie Polytrichum strictum Menzies ex Brid. Considerado um organismo bipolar, pois se desenvolve tanto no Ártico como na Antártica, ainda carece de estudos que esclareçam sua classificação taxonômica, já que por diversas vezes foi conduzido como variante de Polytrichum juniperinum Hedw. devido sua morfologia ser similar a espécie e, sua verdadeira origem ainda não estar clara. Em um estudo, sugeriu-se que P. juniperinum poderia ser o ancestral materno de P. strictum, porém a análise apresentou incongruências. Ainda não se tem estudos moleculares dos espécimes oriundos dos polos e, muito menos abordagens a nível genômico do gênero Polytrichum. Com o advento das tecnologias de seqüênciamento de nova geração, os genomas organelares tornan-se uma ferramenta para estudos filogenéticos, já que fornecem dados sobre o conteúdo gênico e arquitetura do genoma, além de inferências filogenéticas complementares sobre a história evolutiva das espécies. Neste trabalho, foi determinada a sequencia parcial dos genomas do cloroplasto (cpDNA) e mitocondrial (mtDNA) de P. strictum e P. juniperinum, com o objetivo de analisar e caracterizar estruturalmente os genomas acessórios dos exemplares do gênero Polytrichum e inferir nas relações filogenéticas entre P. strictum e P. juniperinum. Os genomas acessórios das espécies foram sequenciados em um sequenciador NGS da Ion Torrent. A montagem, anotação, alinhamento, construção da filogenia e análise sintênica foram realizados in silico com softwares específicos. O cpDNA de P. juniperinum apresenta 55.168 pb compreendendo 51 genes, 31 tRNAs, 4 rRNAs e 19 proteínas relacionadas ao fotossistema I e II. O mtDNA de P. juniperinum compreende um total de 88.021 pb com 67 genes incluindo 19 tRNAs, 5 rRNAs, e 12 proteínas relacionadas ao metabolismo oxidativo. O cpDNA de P. strictum apresenta 20.183 pb compreendendo 45 genes, 14 tRNAs, 4 rRNAs, e 18 proteínas do fotossistema I e II. O mtDNA de P. strictum apresenta 58.896 pb contendo um total de 62 genes, 19 tRNAs, 5 rRNAs, e 13 proteínas relacionadas ao metabolismo oxidativo. Nas análises filogenéticas com cpDNA e mtDNA as árvores consenso apresentaram algumas diferenças no padrão de ramificação, porém P. juniperinum e P. strictum foram agrupadas no mesmo clado. Essas informações geradas a partir do cpDNA e mtDNA de P. juniperinum e P. strictum fornecem um aporte para futuros estudos filogenéticos com os espécimes do Ártico. The Polytrichaceae family has several representants on the Antarctic continent, including Polytrichum strictum Menzies ex Brid. Considered a bipolar organism, because it develops in both the Arctic and Antarctica Continent, it still need studies to clarify its taxonomic classification, since several times it was conducted as a variant of Polytrichum juniperinum Hedw due to its morphology be similar to the species and its true origin still not be clear. In study, it was suggested that P. juniperinum could be the maternal ancestor of P. strictum, but the analysis presented incongruence’s. There are still no molecular studies of the specimens from the poles, let alone genomic approaches of the genus Polytrichum. With advent of new generation sequencing technologies, organellar genomes become as tool for phylogenetic studies, as they provide data on genome content and genome architecture, as well as complementary phylogenetic inferences about the evolutionary history of species. In this work, the sequence of the chloroplast (cpDNA) and mitochondrial (mtDNA) genomes of P. strictum and P. juniperinum was determined with the objective of analyze and structurally characterize the accessory genomes of the genera Polytrichum and infer in the phylogenetic relationships between P. strictum and P. juniperinum.The accessory genomes of the species were sequenced on an Ion Torrent NGS sequencer. Assembly, annotation, alignment, phylogeny construction and syntenic analysis were performed in sílico with specific software. The P. juniperinum cpDNA has 55,168 bp comprising 51 genes, 31 tRNAs, 4 rRNAs and 19 proteins related to photosystem I and II. The P. juniperinum mtDNA comprises a total of 88,021 bp with 67 genes including 19 tRNAs, 5 rRNAs, and 12 proteins related to oxidative metabolism. The P. strictum cpDNA has 20,183 bp comprising 45 genes, 14 tRNAs, 4 rRNAs, and 18 proteins from photosystem I and II. The P. strictum cpDNA has 20,183 bp comprising 45 genes, 14 tRNAs, 4 rRNAs, and 18 proteins from photosystem I and II. The P. strictum mtDNA has 58,896 bp containing a total of 62 genes, 19 tRNAs, 5 rRNAs, and 13 proteins related to oxidative metabolism. In the phylogenetic analyzes with cpDNA and mtDNA the consensus trees presented some differences in the branching pattern, but P. juniperinum and P. strictum were grouped in the same clade. This information generated from cpDNA and mtDNA of P. juniperinum and P. strictum provide a contribution to future phylogenetic studies with the specimens from Arctic.
- Published
- 2017
47. Genomic diversity of the brazilian strains of Streptococcus agalactiae isolated From outbreaks on fish farms
- Author
-
Gustavo Morais Barony, Henrique Cesar Pereira Figueiredo, Carlos Augusto Gomes Leal, Vasco Ariston de Carvalho Azevedo, and Rodrigo Otavio Silveira Silva
- Subjects
estreptococose ,genômica ,filogenética ,Tilapia (Peixe) Doenças ,tMRCA ,genômica comparativa ,Estreptococo ,wgMLST ,tilápia ,MLST - Abstract
A tilapia do Nilo é o peixe mais produzido no Brasil e a expansão de seu cultivo é afetada pelo patógeno Streptococcus agalactiae. Os objetivos dessa dissertação foram realizar uma revisão de literatura sobre estreptococose por S. agalactiae e sua epidemiologia, e analisar a população brasileira desse micro-organismo, estabelecer uma ferramenta para rastrear surtos de estreptococose e distinguir amostras geneticamente próximas. Um total de 39 amostras foram obtidas de surtos e seus genomas foram sequenciados e anotados para análises comparativas de tipagem multilocus (MLST), similaridade genômica, MLST de genoma inteiro (wgMLST) e uma análise evolutiva com inferência Bayesiana da espécie. Os isolados brasileiros de S. agalactiae apresentaram dois STs, dentre os quais um novo descrito pela primeira vez nesse trabalho, e também uma linhagem não tipável. O wgMLST diferenciou cada isolado como um clone único e estabeleceu correlações temporais e geográficas entre as amostras, sendo que os STs 260 e 927 prevaleceram no Nordeste e as amostras não tipáveis, na região Centro-Sul. A análise evolutiva Bayesiana mostrou que a população brasileira de S. agalactiae tem uma emergência muito recente, de cerca de 585 anos. A população brasileira de S. agalactiae se mostrou genomicamente heterogênea e distribuida em diferentes regiões do país conforme seu genótipo, e o wgMLST pode rastrear cada evento de surto individualmente. Nile tilapia is the most produced fish in Brazil and the evolution of its cultivation is affected by the pathogen Streptococcus agalactiae. The aims of this thesis were to review the literature about streptococcosis by S. agalactiae and its epidemiology and to analyze genetic structure of the Brazilian isolates, to establish a method to track outbreaks of streptococcosis and to distinguish closely related strains. A total of 39 strains were obtained from outbreaks and their whole genomes were sequenced and annotated for comparative analysis of multilocus sequence typing (MLST), genomic similarity, whole genome MLST (wgMLST) and a Bayesian evolutionary analysis of the species. The Brazilian strains of S. agalactiae presented two STs, among which a new one just described, and also a non-typeable lineage. The wgMLST could differentiate each strain in a single clone and establish temporal and geographical correlations among strains, wherein STs 260 and 927 predominated in Northeast, and non-typeable strains, on Central-South region. The Bayesian evolutionary analysis revealed that the Brazilian population of S. agalactiae has a remarkably recent emergence, about 585 years ago. Brazilian strains of S. agalactiae showed to be heterogeneous in its genome sequence, distributed in different regions of the country according to the genotype, and wgMLST analysis could track each outbreak event individually.
- Published
- 2017
48. Genômica comparativa de cepas de Aspergillus terreus visando a produção de lovastatina
- Author
-
Rocha, Rodrigo Theodoro, Parachin, Nádia Skorupa, and Pappas Júnior, Georgios Joannis
- Subjects
Genômica comparativa ,Metabólitos secundários ,Aspergillus terreus ,Fungos filamentosos - Abstract
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Biológicas, Departamento de Biologia Celular, Programa de Pós-Graduação em Biologia Molecular, 2017. Metabólitos secundários (MS) são moléculas heterogêneas de baixo peso molecular e, alternativamente aos metabólitos primários, não estão diretamente envolvidas no crescimento do organismo que as produz. Entre os microrganismos produtores de MS destacam-se os fungos filamentosos do gênero Aspergillus, abrangendo diversas espécies com estilos de vida variados e produzindo inúmeros compostos de importância para os homens, animais e plantas. A espécie A. terreus é produtora de diversos MS, entre eles destaca-se a lovastatina, fármaco da classe das estatinas, que são mundialmente utilizadas para a redução dos níveis de colesterol. Visando a bioprospecção de cepas de A. terreus produtoras de lovastatina utilizamos a genômica comparativa para detalhar a estrutura e variabilidade dos genes responsáveis por sua biossíntese. Oito cepas de A. terreus isoladas no Brasil foram submetidas a sequenciamento de segunda geração utilizando a plataforma Illumina. Os dados resultantes foram mapeamentos contra o genoma de referência da espécie (cepa NIH 2624) e observou-se uma conservação de 86% de todo genoma entre as cepas. No entanto, grandes regiões com tamanho maior que 10 kb apresentaram cobertura anômala, e posteriormente verificou-se que se tratava de variantes estruturais (grandes indels) nos genomas das cepas, inclusive no agrupamento gênico de biossíntese (BCG) de lovastatina. As variantes estruturais dentro deste loco foram validadas experimentalmente via ensaios de PCR e a ausência de genes essenciais à biossíntese da lovastatina explica o fenótipo não produtor em algumas cepas. A observação variabilidade genômica entre as cepas motivou o desenvolvimento de uma nova metodologia para detecção de BCGs em geral. Esta baseia-se na estrutura de grafos de Bruijn coloridos e pode ser aplicada diretamente nos dados brutos de sequenciamento, sem necessitar montagens genômicas de alta qualidade. Com esta abordagem foi possível identificar os limites gênicos dos agrupamentos de biossíntese dos metabólitos acetilaranotina, terretonina e outros. As análises de genômica comparativa neste estudo apontam as relevantes diferenças na composição gênica de indivíduos da mesma espécie, as quais podem ser correlacionadas com fenótipos de interesse biotecnológico. Ademais, ressaltam a complexa história evolutiva dos fungos e a plasticidade de seus genomas. Assim como acontece em muitos procariotos, os genomas dos fungos filamentosos devem ser representados por um pan-genoma. Secondary metabolites (SM) are a heterogeneous class of low molecular weight compounds not directly involved in the growth of the producing organism. Among the SM producing microorganisms stands out the genus Aspergillus, a diverse group of filamentous fungi of medical and biotechnological relevance. The species A. terreus is known to produce several metabolites, noticeably lovastatin, belonging to the statins class with worldwide application as cholesterol lowering drugs. Aiming at the bioprospection of lovastatin producing strains we employed a comparative genomics study to pinpoint the structure and variability of the genes involved in its biosynthesis. Eight A. terreus strains, isolated in different locations, were sequenced by second generation genome sequencing platform Illumina. The resulting reads were mapped against the reference genome of A. terreus (strain NIH 2624) unveiling a 86% genome-wide conservation between the strains. However, large blocks spanning over 10 kb showed anomalous mapping coverage depth, and further analyses showed that these were structural variants (large indels) occurring in the genome of the strains. Strikingly, some strains exhibited structural variations in the lovastatin biosynthetic gene cluster (BCG), further validated by PCR assays, which offers a plausible explanation for the non-producing phenotype observed in some strains. The observation of strain-specific genome variation prompted the development of a new BCG detection methodology based on colored de Bruijn graphs and directly applied to raw sequencing data without the necessity of a high quality reference genome. This approach uncovered the presence and the gene boundaries of several BCGs in our study, such as the biosynthetic clusters for the metabolites acetilranotin, terretonin and others. The comparative genomic analyses in this study highlight the gene composition differences among individuals of the same species and the correlation with biotechnological relevant phenotypes. Moreover, underlies the complex fungal evolutive pathways and the plasticity of microbial genomes.
- Published
- 2016
49. Ferramentas para análise filogenética e de distribuição taxonômica de genes ortólogos
- Author
-
Tetsu Sakamoto, Jose Miguel Ortega, Francisco Prosdocimi, Aristoteles Goes Neto, and Lucas Bleicher
- Subjects
Genômica comparativa ,Evolução ,Superárvore ,Bioinformática ,NCBI Taxonomy - Abstract
Estudar as relações evolutivas entre os organismos é um tema que fascina a ciência há vários anos e o seu modo de analisar e inferir a história evolutiva vem se modificando conforme surgem os adventos tecnológicos e novos tipos de dados ao longo da história. O que era, a princípio, analisado por meio de dados morfológicos e de desenvolvimento embrionário, agora pode ser pesquisado com dados moleculares, como sequências nucleotídicas ou de aminoácidos, uma abordagem que domina o campo da filogenia desde a criação da tecnologia de sequenciamento automático de DNA em meados dos anos 80. Durante esse tempo, os métodos de filogenia molecular vêmrecebendo aperfeiçoamentos significativos, mas ainda não resolvem todas as lacunas presentes em vários pontos da árvore da vida. Os métodos de sequenciamento em largaescala vieram para auxiliar na inferência da história evolutiva, mas eles também impõem novos desafios metodológicos, já que muitos procedimentos comuns dafilogenia molecular não conseguem lidar com grande volume de sequências geradas por estas máquinas. Neste contexto, o presente trabalho teve como objetivo gerar ferramentas que atentem com as atuais demandas da filogenia molecular. O presente trabalho gerou três aplicativos: (1) TaxOnTree, (2) HyperTriplets e (3) ELDOgraph. A TaxOnTree é uma ferramenta que incorpora os dados taxonômicosem uma árvore filogenética. A partir das árvores geradas por esta ferramenta, o usuário pode ter um acesso fácil e rápido a todas as informações taxonômicas das amostras presentes na árvore, assim como a relação evolutiva entre elas, tendo como base a árvore taxonômica do NCBI Taxonomy. O HyperTriplets é uma ferramenta queprocessa várias árvores de genes e gera uma superárvore a partir da análise de tripletos. Abordagens que preenchem lacunas do método de superárvore, como a restrição do uso de árvores de genes contendo parálogos na análise e a não inclusão de dados de distância nos ramos da superárvore, foram desenvolvidas e implementadas nesta ferramenta. Por fim, o ELDOgraph é uma ferramenta que utiliza as distâncias filogenéticas para realizar análises comparativas entre as espécies presentes na árvore. Esta ferramenta oferece ao usuário uma forma de verificar e visualizar as proximidades evolutivas diferente da abordagem das árvores filogenéticas. As três ferramentas estãodisponíveis no endereço http://biodados.icb.ufmg.br/taxonphylotools. Studying the evolutionary relationships between organisms is a subject that has fascinated scientists for a long time and the approaches to analyze and infer the evolutionary history has been modified as new technologies and new data types emerge. At first, the morphological and embryogenic data were the main source for phylogenetic analysis, but molecular data, such as nucleotide or amino acid sequences, have ruled the field of phylogenetic studies since the introduction of automated DNA sequencer in the mid 80s. Although molecular phylogenetic had received significant methodological improvements during this time, there are still several unresolved parts in the tree of life. Development and popularization of large-scale sequencing technologies came to help inelucidating the gaps in the evolutionary history, but they also impose newmethodological challenges, since several common procedures in molecular phylogeny do not deal with a large amount of sequences generated by these machines. In this context, the objectives of the present work were to develop molecular phylogenetic tools that meet the current demands in molecular phylogeny. We developed three applications in this work: (1) TaxOnTree, (2) HyperTriplets and (3) ELDOgraph. TaxOnTree is a tool that includes taxonomic data into a phylogenetic tree. The trees generated by this tool provide users with an easy and fast way to access all taxonomic information of the samples in the tree, as well as the evolutionary relationship between them based on the taxonomic tree from NCBI Taxonomy. The HyperTriplets is a tool that reads and processes several gene trees to reconstruct a supertree based on analysis of triplets. Approaches that fill some gaps in the supertree methodology, as the restriction on using gene trees with paralogs and the lack of distance values in the supertree branches, were developed and implemented in this tool. Finally, the ELDOgraph is a tool that extracts the phylogenetic distances in several gene trees to perform a comparative analysis amongst the sampled species. This tool provides a new approach to verify and visualize the evolutionary proximity in adistinct way from the tree structure approach. All three tools are available at http://biodados.icb.ufmg.br/taxonphylotools.
- Published
- 2016
50. Análise genômica comparativa de corinebactérias patogênicas emergentes com implicações para o desenvolvimento de testes diagnósticos melhorados
- Author
-
Santos, Carolina Silva, Pacheco, Luis Gustavo Carvalho, Vilela, Liza Figueiredo Felicori, and Farias, Leonardo Paiva
- Subjects
Genômica comparativa ,Identificação bacteriana ,Patógenos emergentes ,Ciências Biológicas - Abstract
Submitted by PMBqBM null (pmbqbm@ufba.br) on 2017-05-10T14:51:23Z No. of bitstreams: 1 Dissertação Carolina Silva Santos_PMBqBM-UFBA.pdf: 2998209 bytes, checksum: 2714643c2dfb9f9dbd59e1a7e720cc52 (MD5) Approved for entry into archive by Delba Rosa (delba@ufba.br) on 2017-07-27T15:05:10Z (GMT) No. of bitstreams: 1 Dissertação Carolina Silva Santos_PMBqBM-UFBA.pdf: 2998209 bytes, checksum: 2714643c2dfb9f9dbd59e1a7e720cc52 (MD5) Made available in DSpace on 2017-07-27T15:05:10Z (GMT). No. of bitstreams: 1 Dissertação Carolina Silva Santos_PMBqBM-UFBA.pdf: 2998209 bytes, checksum: 2714643c2dfb9f9dbd59e1a7e720cc52 (MD5) FAPESB Corinebactérias não diftéricas têm sido reconhecidas como agentes causadores de infecções oportunistas e nosocomiais em seres humanos. A identificação destas bactérias pelos testes mais comumente utilizados, baseados em baterias de 20 reações bioquímicas, é considerada desafiadora e normalmente requer a utilização de métodos adicionais, incluindo o sequenciamento do gene 16S rRNA e análises por espectrometria de massas do tipo MALDI-TOF. Em particular, as espécies frequentemente reportadas C. amycolatum, C. striatum, C. xerosis e C. minutissimum normalmente geram perfis bioquímicos que podem levar a identificações ambíguas ou mesmo completamente equivocadas nos laboratórios de microbiologia clínica. Para algumas destas espécies, o sequenciamento parcial ou total de um gene de referência adicional, rpoB, pode ser necessário para alcançar identificações não ambíguas e mesmo esta estratégia pode falhar. Neste contexto, o objetivo deste trabalho foi utilizar a genômica comparativa para identificação de novos alvos que possam contribuir para identificação rápida e confiável destas corinebactérias. Sequências genômicas completas de três isolados, C. minutissimum 1941, C. striatum 1961, e C. xerosis ATCC 373T, foram geradas pelo nosso grupo. Nós utilizamos o servidor RAST (Rapid Annotation using Subsystem Technology) para anotar automaticamente estes genomas e a análise genômica comparativa foi realizada através do EDGAR (Efficient Database framework for comparative Genome Analyses using BLAST score Ratios). O genoma publicamente disponível da linhagem SK46 de C. amycolatum também foi incluído nestas análises. A anotação genômica automatizada permitiu a identificação de um número médio de 2.539 sequências codificadoras por genoma e foi possível identificar um número de genes distintos para cada espécie. Oligonucleotídeos iniciadores foram desenhados para detecção de genes espécie-específicos para o desenvolvimento de novos métodos de identificação molecular que foram capazes de identificar de forma não ambígua um pequeno painel de linhagens de C. xerosis, C. striatum e C. amycolatum. Os resultados destes novos testes obtiveram 100% de concordância com as identificações obtidas pelo sequenciamento dos genes 16S rRNA e rpoB dos isolados bacterianos estudados.
- Published
- 2016
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.