Back to Search Start Over

Distribuição dos tamanhos de DNA humano codificante via teoria da informação

Authors :
Correia, Jonathan Pessoa
Anselmo, Dory Helio Aires de Lima
Macedo Filho, Antônio de
Silva Júnior, Raimundo
Source :
Repositório Institucional da UFRN, Universidade Federal do Rio Grande do Norte (UFRN), instacron:UFRN
Publication Year :
2021
Publisher :
Universidade Federal do Rio Grande do Norte, 2021.

Abstract

Analisamos as sequências codificantes do DNA do Homo Sapiens por meio de um modelo que naturalmente envolve correlações entre as bases nas sequências de DNA dos organismos vivos. O modelo é baseado na otimização da entropia de Shannon, que é o centro de todos os argumentos estatísticos. No presente trabalho, propomos a função de distribuição de dupla exponencial dos comprimentos do DNA medido em pares de bases (pb). Os resultados mostram que as Correlações de Curto Alcance (CCA), sempre presentes nas sequências de DNA codificantes, são apropriadamente capturadas por meio da distribuição dupla exponencial e descreve adequadamente a distribuição de comprimentos cumulativos das bases de DNA. Com base neste modelo, usamos uma função de distribuição cumulativa empírica e o banco de dados de proteínas compilado pelo Projeto Ensembl para mostrar consistência com os dados. We analyze the coding sequence for the Homo Sapiens DNA via a model that naturally embraces correlations among the bases in DNA sequences of living organisms. The model is based on the Shannon entropy’s optimization, which is the core of all statistical arguments. On our work , we propose the double-exponential1 distribution function of the length of DNA measured in base pairs (bp). The results show that the ShortRange-Correlations (SRC), always present in coding DNA sequences, are appropriately captured through the double-exponential distribution and adequately describes the cumulative length distribution of DNA bases. Based on this model, we use an Empirical cumulative distribution function and the database of proteins compiled by the Ensembl Project to show consistency with the data.

Details

Language :
Portuguese
Database :
OpenAIRE
Journal :
Repositório Institucional da UFRN, Universidade Federal do Rio Grande do Norte (UFRN), instacron:UFRN
Accession number :
edsair.od......3056..0d39489c222ce9fef89034ea56e7ed8f