Back to Search Start Over

Normalização de dados de expressão gênica de leucemia linfóide aguda pelo volume celular

Authors :
Vasconcelos, Victor Sande, 1988
Yunes, José Andrés, 1967
Carazzolle, Marcelo Falsarella
Kiihl, Samara Flamini
Universidade Estadual de Campinas. Instituto de Biologia
Programa de Pós-Graduação em Genética e Biologia Molecular
UNIVERSIDADE ESTADUAL DE CAMPINAS
Source :
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP), Universidade Estadual de Campinas (UNICAMP), instacron:UNICAMP
Publication Year :
2020
Publisher :
Universidade Estadual de Campinas - Repositorio Institucional, 2020.

Abstract

Orientador: José Andrés Yunes Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia Resumo: Análise de expressão gênica tem sido amplamente utilizada para se entender fenômenos biológicos e diferenciar subtipos de Leucemia Linfoide Aguda (LLA). Dados de expressão gênica geralmente são obtidos pra uma mesma massa de RNA por amostra. Diferenças nos volumes celulares são desprezadas nas análises estatísticas tradicionais, induzindo a resultados que podem não ser fiel a realidade. Neste trabalho, mediram-se os volumes celulares e realizou-se uma diferente estratégia de normalização para investigar o comportamento individual dos genes ao longo do crescimento celular. Trabalhos anteriores mostraram que a expressão de um gene possui uma tendência linear com o crescimento celular, porém cada gene possui seu próprio padrão linear (Padovan-Merhar et al., 2015). Por causa disso, a normalização da expressão gênica baseada na massa de RNA e/ou na média da expressão global resulta num desvio volume-dependente no valor da expressão que não é consistente com a real expressão da célula. Assim, o objetivo deste projeto é propor uma metodologia para a normalização da expressão gênica de acordo com o volume celular, obtendo assim, uma correção volume-dependente dos valores de expressão. Para tal, este trabalho foi realizado a partir de microarranjos de DNA da Affymetrix para 91 casos de LLA (LLA provenientes de células B) para quais também se tem uma estimativa do volume celular pela análise das lâminas de sangue de medula. Análises estatísticas e cálculos foram realizados com a linguagem R. Alguns pacotes como "Affy", "genefilter" e outros pacotes do Bioconductor foram usados para se obter a esperança e variabilidade, como função do volume celular para 32.321 genes. Além disso, Análise de Componente Principal foi usada em cada subdomínio da variável volume a fim de se obter a dinâmica do sistema multivariado. As amostras de LLA usadas nesse trabalho apresentaram um fold-change de 5,5 entre o maior e menor volume celular médio. Comparações entre as células maiores e menores, dentro de um mesmo subtipo molecular de LLA revelou cerca de 1000 genes que possuem fold-change maior que 1,5 e baixo desvio-padrão ao longo do domínio do volume. Genes com alto fold-change volume-dependente pertencem a diversas vias e funções no entanto, as mais enriquecidas estão ligadas ao ciclo celular, replicação de DNA etc. Além disso, análise não-supervisionada de Componente Principal (PCA), ao longo do volume, revelou que importantes genes para diferenciação dos subtipos de LLA mudam em função do volume celular. Conclui-se que a expressão de um único gene em diferentes amostras de LLA mostram tendências volume-dependentes de tal maneira que a análise tradicional de expressão gênica diferencial, usando a normalização convencional, resulta em perda importante de informação Abstract: Gene expression analysis has been widely used to understand biological phenomena and to discriminate Acute Lymphocytic Leukemia (ALL) subtypes. Gene expression data are usually obtained based on the same RNA mass per sample. Differences in cellular volume are disregarded in regular statistical analysis, leading to results that may not be consistent with reality. In this work, we measure cell size and performed a different normalization strategy to investigate how individual gene expression behaves along cellular volume increase. Previous work showed that gene expression has a linear trend when the cell volume increases but each gene has its own linear pattern (Padovan-Merhar et al., 2015). Because of that, gene expression normalization based on RNA mass and/or global expression average results in a volume-dependent deviation in the expression value that is not consistent with actual expression per cell. The aim of this study is to propose a method for gene expression normalization according to cell volume, obtaining, in this way, a volume-dependent correction in the expression values. The work was done using Affymetrix microarray data from 91 cases of ALL (91 precursor B-cell ALL), for which we also have an estimate of the cellular size by flow cytometry and bone marrow smears. Statistical analysis and calculations were done using the R software. Some packages as "Affy" and "genefilter" Packages (Bioconductor) were used to obtain the expression expectation and variability, as a cell volume function, for 32,321 genes. Principal Component Analysis has been used in every volume spectrum fragment. The ALL samples used in this work showed a 5.5 fold-change variation between the smallest and biggest average cell volume. Comparison of smaller versus bigger cells, within each molecular subgroup of ALL, revealed around 1,000 genes that have a fold-change greater than 2 and low standard deviation throughout the volume spectrum. Genes with higher volume-dependent fold-changes belong to diverse pathway and functions. However, cell cycle genes and histones appear frequently. Furthermore, unsupervised PCA analyses, over the volume spectrum, showed that important genes for the discrimination between ALL subtypes change as a function of cell volume. The expression of a single gene in different ALL samples shows diverse volume-dependent trends. Differential gene expression analysis using current normalization strategies resulted in lost of important information Mestrado Bioinformática Mestre em Genética e Biologia Molecular FAPESP 2017/02301-9

Details

Database :
OpenAIRE
Journal :
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP), Universidade Estadual de Campinas (UNICAMP), instacron:UNICAMP
Accession number :
edsair.doi.dedup.....1f762731928ff53d07f6faf44619dfeb
Full Text :
https://doi.org/10.47749/t/unicamp.2019.1091635