9 results on '"Kiihl, Samara Flamini"'
Search Results
2. A multiparametric and orthogonal approach indicates low toxicity for zein nanoparticles in a repellent formulation
- Author
-
Almeida, Tuanny Leite, Moreira, Aline Francisca, de Oliveira, Jhones Luiz, Rogerio, Carolina Barbara, Kiihl, Samara Flamini, Fraceto, Leonardo Fernandes, and de Jesus, Marcelo Bispo
- Published
- 2024
- Full Text
- View/download PDF
3. Bioinformatic Estimation of DNA Methylation and Hydroxymethylation Proportions
- Author
-
Kiihl, Samara Flamini, primary
- Published
- 2021
- Full Text
- View/download PDF
4. Analise estatistica de polimorfismo molecular em sequencias de DNA utilizando informações filogeneticas
- Author
-
Kiihl, Samara Flamini, 1980, Pinheiro, Hildete Prisco, 1966, Marques, Mauro Sergio de Freitas, Paula, Gilberto Alvarenga, Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica, Programa de Pós-Graduação em Estatística, and UNIVERSIDADE ESTADUAL DE CAMPINAS
- Subjects
Simulation (Computers) - Statistical methods ,Linear models (Statistics) ,Modelos lineares (Estatística) ,Bioestatística ,Biostatistics ,Simulação (Computadores) - Métodos estatísticos - Abstract
Orientador: Hildete Prisco Pinheiro Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica Resumo: Variacao genetica no nivel de nucleotideo e uma fonte poderosa de informacao para o estudo da evolucao de uma populacao. Importantes aspectos da evolucao de populacoes naturais tem sido investigados utilizando sequencias de nucleotideos. A quantidade ? = 4N?, em que N e o tamanho efetivo da populacao e ? e a taxa de mutacao por sequencia (gene, locus) por geracao, e um parametro essencial porque determina o grau de polimorfismo em um locus. O sucesso da inferencia sobre a evolucao de uma populacao e medido pela acuracia da estimacao deste parametro. Esta dissertacao de mestrado apresenta diversos metodos de estimacao do parametro ?, bem como uma comparacao entre eles atraves de simulacoes e aplicacoes a dados reais. Utilizando informacoes filogeneticas de amostras de sequencias de DNA, constr'oi-se um modelo linear onde o coeficiente da variavel independente e a estimativa do parametro ?. Verificou-se que utilizando informacoes filogeneticas dos dados obtem-se estimadores bem mais eficientes Abstract: Genetic variation at the nucleotide level is a powerful source of information for studying the evolution of a population. Important aspects of the evolution of a population have been investigated by using nucleotide sequences. The quantity ? = 4N?, where N is the effective size of the population and ? is the mutation rate per sequence (gene, locus) per generation, is an essential parameter because it determines the degree of polymorphism at the locus. The degree of success in our inference about the evolution of a population is measured to some extent by the accuracy of estimation of this essential parameter. This work presents some methods of estimation of this parameter, comparisons between the different methods through computational simulations and applications to real data. The evolution of a species can be seen through a phylogenetic tree and a linear model can be constructed by using the phylogenetic information to estimate ?. It has been verified that the use of such information leads us to more accurate estimators of ? Mestrado Estatística Mestre em Estatística
- Published
- 2021
- Full Text
- View/download PDF
5. Análise e desenvolvimento de protocolos em bioinformática para estudos de epigenética
- Author
-
Souza, Wélliton de, 1990, Lopes-Cendes, Íscia Teresinha, 1964, Cendes, Iscia Teresinha Lopes, 1964, Lobo, Francisco Pereira, Kiihl, Samara Flamini, Universidade Estadual de Campinas. Faculdade de Ciências Médicas, Programa de Pós-Graduação em Fisiopatologia Médica, and UNIVERSIDADE ESTADUAL DE CAMPINAS
- Subjects
Computational biology ,DNA methylation ,Epilepsy ,Repressão epigenética ,Epigenetic repression ,Metilação de DNA ,Biologia computacional ,Epilepsia - Abstract
Orientador: Iscia Teresinha Lopes Cendes Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Médicas Resumo: As variações que ocorrem durante a divisão celular e modificam a expressão gênica sem alterar a sequência de DNA associada àquela região são denominadas modificações epigenéticas. Elas estão envolvidas no silenciamento de genes, diferenciação de tecidos e, eventualmente, nos mecanismos moleculares responsáveis por uma série de fenótipos. A metilação de DNA, uma modificação epigenética que altera a cromatina, tem sido estudada extensivamente em vários processos biológicos normais e patológicos. Com o avanço dos métodos e tecnologias de sequenciamento de DNA, hoje é possível realizar análises para determinação de perfis de metilação e suas associações com fenótipos de interesse. Esta dissertação adiciona a perspectiva analítica da epigenética associada aos estudos de modelos animais de epilepsia. Foram definidos protocolos em bioinformática para processamento de dados de metilação do DNA. Os perfis de metilação foram determinados e associados aos fenótipos de epilepsia dos animais estudados, o que também permitiu a identificação de oportunidades para o desenvolvimento de novas ferramentas e automatizações dos protocolos definidos Abstract: Epigenetic changes are those that occur during cellular division, modifying gene expression without changes on the DNA sequence. They are involved in gene silencing, tissue differentiation and in molecular mechanisms of a number of phenotypes. DNA methylation, an epigenetic modification that changes chromatin, has been studied extensively in various normal and pathologic biological processes. With the advancement of methods and technologies for DNA sequencing, it is now possible to perform analysis to determine methylation profiles and their association with phenotypes of interest. This dissertation adds the analytical perspective of epigenetics related to studies of animal models of epilepsy. Protocols were defined in bioinformatics processing of DNA methylation data. Methylation profiles were determined and associated with epilepsy phenotypes of animals studied, which also allowed the identification of opportunities for the development of new tools and automation of defined protocols Mestrado Fisiopatologia Médica Mestre em Ciências FAPESP 2013/24801-2
- Published
- 2021
- Full Text
- View/download PDF
6. Métodos estatísticos para modelagem de dados de scRNA-seq
- Author
-
Menezes, André Felipe Berdusco, 1996, Carvalho, Benilton de Sá, 1979, Kiihl, Samara Flamini, Veiga, Diogo Fernando, Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica, Programa de Pós-Graduação em Estatística, and UNIVERSIDADE ESTADUAL DE CAMPINAS
- Subjects
Differential expression ,Cluster analysis ,Dados omics ,Omics data ,Análise por agrupamento ,scRNA-seq ,Bioestatística ,Biostatistics ,Expressão diferencial - Abstract
Orientador: Benilton de Sá Carvalho Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica Resumo: A tecnologia de sequenciamento massivo de DNA e RNA permitiu desenvolvimentos significativos na área de biomédicas, culminando, neste momento, na implementação da medicina de precisão, em que informações moleculares do paciente são levadas em consideração para a tomada de decisão no curso de tratamento. Em geral, o sequenciamento de DNA ou RNA é realizado a partir de uma amostra do tipo bulk, em que o material molecular de várias células é combinado para a realização das análises de interesse. Com o avanço tecnológico mais recente, tornou-se possível o sequenciamento do material genético no nível das células, permitindo a análise de fenótipos de interesse, como doenças diversas, numa resolução ainda mais granular que aquela oferecida por amostras do tipo bulk. Especificamente, a tecnologia de single-cell RNA sequencing (scRNA-seq) permite criar perfis de expressão na resolução da célula. A vasta quantidade de dados produzida por experimentos de scRNA-seq e as hipóteses de pesquisa que os motivam exigem um tratamento computacional e estatístico eficiente. Nesse sentido, o objetivo dessa pesquisa foi estudar as técnicas utilizadas para análise dos dados em experimentos scRNA-seq, que incluem (i) métodos para pré-processamento, (ii) processamento da matriz de contagem e (iii) métodos estatísticos para análise dos dados. Além disso, motivado por um conjunto de dados de células do tecido BALF de pacientes com COVID-19, um estudo de simulação foi conduzido considerando as características particulares dos dados para comparar diferentes abordagens para análise de expressão diferencial que incorporam a origem da célula. Por fim, o fluxo usual de análise discutido no trabalho foi empregado para analisar o conjunto de dados de células BALF, caracterizando grupos de células e comparando os níveis de expressão gênica dos indivíduos sob diferentes condições experimentais Abstract: High-throughput sequencing technology allowed significant developments in the biomedical area, culminating, at this moment, in the implementation of precision medicine, where the patient's molecular information is taken into consideration for decision making in the treatment course. In general, the DNA or RNA sequencing is performed from bulk sample, where the molecular material of several cells is combined to perform the analysis of interested. Especially, the technology of single cell RNA sequencing (scRNA-seq) enables high-throughput transcriptome profiling at the resolution of single cells. The vast amount of data produced by scRNA-seq experiments and the research hypotheses that motivate them require efficient computational and statistical treatment. Hence, the goal of this research was to study the techniques used for data analysis in scRNA-seq, which include (i) methods for pre-processing raw data, (ii) data processing of counting matrix and (iii) statistical methods for data analysis. In addition, motivated by a data set of cells from bronchoalveolar lavage fluid (BALF) tissue from patients with COVID-19, a simulation study was conducted, considering the particularities of the data, to compare different approaches for differential expression analysis that incorporate the cell's origin. Finally, the usual workflow discussed in the research was adopted to analyze the BALF cells data set by characterizing groups of cells and comparing the expression genes levels of individuals under different experimental conditions Mestrado Estatística Mestre em Estatística CNPQ 132278/2019-7
- Published
- 2021
7. Normalização de dados de expressão gênica de leucemia linfóide aguda pelo volume celular
- Author
-
Vasconcelos, Victor Sande, 1988, Yunes, José Andrés, 1967, Carazzolle, Marcelo Falsarella, Kiihl, Samara Flamini, Universidade Estadual de Campinas. Instituto de Biologia, Programa de Pós-Graduação em Genética e Biologia Molecular, and UNIVERSIDADE ESTADUAL DE CAMPINAS
- Subjects
Tamanho celular ,Normalização ,Gene expression ,Expressão gênica ,Standardization ,Cell size - Abstract
Orientador: José Andrés Yunes Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia Resumo: Análise de expressão gênica tem sido amplamente utilizada para se entender fenômenos biológicos e diferenciar subtipos de Leucemia Linfoide Aguda (LLA). Dados de expressão gênica geralmente são obtidos pra uma mesma massa de RNA por amostra. Diferenças nos volumes celulares são desprezadas nas análises estatísticas tradicionais, induzindo a resultados que podem não ser fiel a realidade. Neste trabalho, mediram-se os volumes celulares e realizou-se uma diferente estratégia de normalização para investigar o comportamento individual dos genes ao longo do crescimento celular. Trabalhos anteriores mostraram que a expressão de um gene possui uma tendência linear com o crescimento celular, porém cada gene possui seu próprio padrão linear (Padovan-Merhar et al., 2015). Por causa disso, a normalização da expressão gênica baseada na massa de RNA e/ou na média da expressão global resulta num desvio volume-dependente no valor da expressão que não é consistente com a real expressão da célula. Assim, o objetivo deste projeto é propor uma metodologia para a normalização da expressão gênica de acordo com o volume celular, obtendo assim, uma correção volume-dependente dos valores de expressão. Para tal, este trabalho foi realizado a partir de microarranjos de DNA da Affymetrix para 91 casos de LLA (LLA provenientes de células B) para quais também se tem uma estimativa do volume celular pela análise das lâminas de sangue de medula. Análises estatísticas e cálculos foram realizados com a linguagem R. Alguns pacotes como "Affy", "genefilter" e outros pacotes do Bioconductor foram usados para se obter a esperança e variabilidade, como função do volume celular para 32.321 genes. Além disso, Análise de Componente Principal foi usada em cada subdomínio da variável volume a fim de se obter a dinâmica do sistema multivariado. As amostras de LLA usadas nesse trabalho apresentaram um fold-change de 5,5 entre o maior e menor volume celular médio. Comparações entre as células maiores e menores, dentro de um mesmo subtipo molecular de LLA revelou cerca de 1000 genes que possuem fold-change maior que 1,5 e baixo desvio-padrão ao longo do domínio do volume. Genes com alto fold-change volume-dependente pertencem a diversas vias e funções no entanto, as mais enriquecidas estão ligadas ao ciclo celular, replicação de DNA etc. Além disso, análise não-supervisionada de Componente Principal (PCA), ao longo do volume, revelou que importantes genes para diferenciação dos subtipos de LLA mudam em função do volume celular. Conclui-se que a expressão de um único gene em diferentes amostras de LLA mostram tendências volume-dependentes de tal maneira que a análise tradicional de expressão gênica diferencial, usando a normalização convencional, resulta em perda importante de informação Abstract: Gene expression analysis has been widely used to understand biological phenomena and to discriminate Acute Lymphocytic Leukemia (ALL) subtypes. Gene expression data are usually obtained based on the same RNA mass per sample. Differences in cellular volume are disregarded in regular statistical analysis, leading to results that may not be consistent with reality. In this work, we measure cell size and performed a different normalization strategy to investigate how individual gene expression behaves along cellular volume increase. Previous work showed that gene expression has a linear trend when the cell volume increases but each gene has its own linear pattern (Padovan-Merhar et al., 2015). Because of that, gene expression normalization based on RNA mass and/or global expression average results in a volume-dependent deviation in the expression value that is not consistent with actual expression per cell. The aim of this study is to propose a method for gene expression normalization according to cell volume, obtaining, in this way, a volume-dependent correction in the expression values. The work was done using Affymetrix microarray data from 91 cases of ALL (91 precursor B-cell ALL), for which we also have an estimate of the cellular size by flow cytometry and bone marrow smears. Statistical analysis and calculations were done using the R software. Some packages as "Affy" and "genefilter" Packages (Bioconductor) were used to obtain the expression expectation and variability, as a cell volume function, for 32,321 genes. Principal Component Analysis has been used in every volume spectrum fragment. The ALL samples used in this work showed a 5.5 fold-change variation between the smallest and biggest average cell volume. Comparison of smaller versus bigger cells, within each molecular subgroup of ALL, revealed around 1,000 genes that have a fold-change greater than 2 and low standard deviation throughout the volume spectrum. Genes with higher volume-dependent fold-changes belong to diverse pathway and functions. However, cell cycle genes and histones appear frequently. Furthermore, unsupervised PCA analyses, over the volume spectrum, showed that important genes for the discrimination between ALL subtypes change as a function of cell volume. The expression of a single gene in different ALL samples shows diverse volume-dependent trends. Differential gene expression analysis using current normalization strategies resulted in lost of important information Mestrado Bioinformática Mestre em Genética e Biologia Molecular FAPESP 2017/02301-9
- Published
- 2020
- Full Text
- View/download PDF
8. Classification models : applications in banking sector
- Author
-
Caetano, Mateus, 1983, Moretti, Antonio Carlos, 1958, Ruggiero, Márcia Aparecida Gomes, 1956, Kiihl, Samara Flamini, Oliveira, Washington Alves de, Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica, Programa de Pós-Graduação em Matemática Aplicada, and UNIVERSIDADE ESTADUAL DE CAMPINAS
- Subjects
Neural networks (Computer science) ,Support vectors machine ,Logistic regression analysis ,Redes neurais (Computação) ,Decision trees ,Análise de regressão logística ,Máquina de vetores de suporte ,Árvores de decisão ,Classificação - Modelos matemáticos ,Classification - Mathematical models - Abstract
Orientadores: Antonio Carlos Moretti, Márcia Aparecida Gomes Ruggiero Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica Resumo: Técnicas para solucionar problemas de classificação têm aplicações em diversas áreas, como concessão de crédito, reconhecimento de imagens, detecção de SPAM, entre outras. É uma área de intensa pesquisa, para a qual diversos métodos foram e continuam sendo desenvolvidos. Dado que não há um método que apresente o melhor desempenho para qualquer tipo de aplicação, diferentes métodos precisam ser comparados para que possamos encontrar o melhor ajuste para cada aplicação em particular. Neste trabalho estudamos seis diferentes métodos aplicados em problemas de classificação supervisionada (onde há uma resposta conhecida para o treinamento do modelo): Regressão Logística, Árvore de Decisão, Naive Bayes, KNN (k-Nearest Neighbors), Redes Neurais e Support Vector Machine. Aplicamos os métodos em três conjuntos de dados referentes à problemas de concessão de crédito e seleção de clientes para campanha de marketing bancário. Realizamos o pré-processamento dos dados para lidar com observações faltantes e classes desbalanceadas. Utilizamos técnicas de particionamento do conjunto de dados e diversas métricas, como acurácia, F1 e curva ROC, com o objetivo de avaliar os desempenhos dos métodos/técnicas. Comparamos, para cada problema, o desempenho dos diferentes métodos considerando as métricas selecionadas. Os resultados obtidos pelos melhores modelos de cada aplicação foram compatíveis com outros estudos que utilizaram os mesmos bancos de dados Abstract: Techniques for classification problems have applications on many areas, such as credit risk evaluation, image recognition, SPAM detection, among others. It is an area of intense research, for which many methods were and continue to be developed. Given that there is not a method whose performance is better across any type of problems, different methods need to be compared in order to select the one that provides the best adjustment for each application in particular. In this work, we studied six different methods applied to supervised classification problems (when there is a known response for the model training): Logistic Regression, Decision Tree, Naive Bayes, KNN (k-Nearest Neighbors), Neural Networks and Support Vector Machine. We applied these methods on three data sets related to credit evaluation and customer selection for a banking marketing campaign. We made the data pre-processing to cope with missing data and unbalanced classes. We used data partitioning techniques and several metrics, as accuracy, F1 and ROC curve, in order to evaluate the methods/techniques performances. We compared, for each problem, the performances of the different methods using the selected metrics. The results obtained for the best models on each application were comparable to other studies that have used the same data sources Mestrado Matemática Aplicada Mestra em Matemática Aplicada CNPQ
- Published
- 2015
9. Bioinformatic Estimation of DNA Methylation and Hydroxymethylation Proportions.
- Author
-
Kiihl SF
- Subjects
- DNA genetics, High-Throughput Nucleotide Sequencing, Humans, Oxidation-Reduction, 5-Methylcytosine analogs & derivatives, 5-Methylcytosine chemistry, Computational Biology methods, DNA analysis, DNA chemistry, DNA Methylation, Epigenesis, Genetic, Sulfites chemistry
- Abstract
Simultaneous measurement of 5-methylcytosine (5-mC) and 5-hydroxymethylcytosine (5-hmC) at the single-nucleotide level can be obtained by combining data from DNA processing methods including traditional bisulfite (BS), oxidative bisulfite (oxBS), or Tet-assisted (TAB) bisulfite conversion. Array-based technologies have been widely used in this task, due to their time and cost efficiency. For methylation studies using BS data, many protocols and related packages have been suggested in the literature to deal with limitations and confounders that arise from array data. In this chapter, we illustrate how the reader can make small adjustments to these protocols to obtain estimates of methylation and hydroxymethylation proportions.
- Published
- 2021
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.