Back to Search
Start Over
Distribuição dos tamanhos de DNA humano codificante via teoria da informação
- Source :
- Repositório Institucional da UFRN, Universidade Federal do Rio Grande do Norte (UFRN), instacron:UFRN
- Publication Year :
- 2021
- Publisher :
- Universidade Federal do Rio Grande do Norte, 2021.
-
Abstract
- Analisamos as sequências codificantes do DNA do Homo Sapiens por meio de um modelo que naturalmente envolve correlações entre as bases nas sequências de DNA dos organismos vivos. O modelo é baseado na otimização da entropia de Shannon, que é o centro de todos os argumentos estatísticos. No presente trabalho, propomos a função de distribuição de dupla exponencial dos comprimentos do DNA medido em pares de bases (pb). Os resultados mostram que as Correlações de Curto Alcance (CCA), sempre presentes nas sequências de DNA codificantes, são apropriadamente capturadas por meio da distribuição dupla exponencial e descreve adequadamente a distribuição de comprimentos cumulativos das bases de DNA. Com base neste modelo, usamos uma função de distribuição cumulativa empírica e o banco de dados de proteínas compilado pelo Projeto Ensembl para mostrar consistência com os dados. We analyze the coding sequence for the Homo Sapiens DNA via a model that naturally embraces correlations among the bases in DNA sequences of living organisms. The model is based on the Shannon entropy’s optimization, which is the core of all statistical arguments. On our work , we propose the double-exponential1 distribution function of the length of DNA measured in base pairs (bp). The results show that the ShortRange-Correlations (SRC), always present in coding DNA sequences, are appropriately captured through the double-exponential distribution and adequately describes the cumulative length distribution of DNA bases. Based on this model, we use an Empirical cumulative distribution function and the database of proteins compiled by the Ensembl Project to show consistency with the data.
- Subjects :
- DNA humano
Entropia Shannon
Teoria da informação
Física
Subjects
Details
- Language :
- Portuguese
- Database :
- OpenAIRE
- Journal :
- Repositório Institucional da UFRN, Universidade Federal do Rio Grande do Norte (UFRN), instacron:UFRN
- Accession number :
- edsair.od......3056..0d39489c222ce9fef89034ea56e7ed8f