1. Transcriptome analysis using RNA-Seq fromexperiments with and without biological replicates: areview
- Author
-
Molinari, Mayla Daiane Correa, Fuganti-Pagliarini, Renata, Angelotti Mendonça, Jéssika, de Amorim Barobosa, Daniel, Rockenbach Marin, Daniel, Mertz-Henning, Liliane, and Lima Nepomuceno, Alexandre
- Subjects
RNA-seq com e sem replicatas sequenciadas ,sequenciamento ,bioinformática ,pipeline ,RNA ,Análises transcricionais ,genética vegetal ,sequencing ,bioinformatics - Abstract
The discovery of nucleic acids opened new frontiers of knowledge, enabling researchers to access an enormous amount of data, through large-scale sequencing methodologies and bioinformatics tools. Amongst these new possibilities, RNA-Seq has been used to identify and quantify RNA molecules. To obtain more accurate biological responses from RNA-Seq data some questions should be considered such as experimental design, type of synthesized library, size of the fragments generated, number of biological replicates, depth, and coverage of the sequencing, species genome availability, and, the choice of software to properly perform the computational analyzes. Accurate bioinformatics analyzes allow the selection of genes with a lower error rate, increasing the validation assertiveness via RT-qPCR and thus, reducing costs. The objective of this review was to present the analysis stages of RNA-Seq data, from experimental design to system biology, considering relevant points, as well as to pointed out some software currently available to carry these analyzes out. Besides, with this review, we aimed to help the academic community to understand all steps and biases involved in RNA-Seq data analysis, from experiments with or without biological replicates. A descoberta de ácidos nucléicos abriu novas fronteiras de conhecimento, permitindo que os pesquisadores acessassem uma enorme quantidade de dados, através de metodologias de sequenciamento em larga escala e ferramentas de bioinformática. Entre essas novas possibilidades, o RNA-Seq (sequenciamento de RNA) tem sido usado para identificar e quantificar moléculas de RNA. Para obter respostas biológicas mais precisas a partir dos dados de RNA-Seq, algumas questões devem ser consideradas, como o desenho experimental, o tipo de biblioteca sintetizada, o tamanho dos fragmentos gerados, o número de repetições biológicas, a profundidade e cobertura do sequenciamento, a disponibilidade do genoma da espécie e, a escolha dos softwares para executar adequadamente as análises computacionais. Análises bioinformáticas precisas permitem a seleção de genes com menor taxa de erro, aumentando a assertividade da validação via RT-qPCR e, assim, reduzindo custos. O objetivo desta revisão foi apresentar as etapas de análise de dados de RNA-Seq, desde o projeto experimental até a biologia do sistema, considerando pontos relevantes, bem como apontar alguns softwares atualmente disponíveis para realizar essas análises. Além disso, com esta revisão, objetivamos ajudar a comunidade acadêmica a compreender todas as etapas e vieses envolvidos na análise de dados de RNA-Seq, a partir de experimentos com ou sem réplicas biológicas.
- Published
- 2021