Back to Search
Start Over
Integración de datos ómicos y clínicos: nuevos avances en la frontera entre biología y medicina
- Source :
- O2, repositorio institucional de la UOC, Universitat Oberta de Catalunya (UOC)
- Publication Year :
- 2020
- Publisher :
- Universitat Oberta de Catalunya (UOC), 2020.
-
Abstract
- Hoy en día resulta imprescindible el uso de datos biológicos de alta resolución en un ámbito Biomédico. Esta información molecular, expresada en diferentes enfoques ómicos (genómica, transcriptómica, proteómica, metabolómica), explica diferentes parcelas de la variabilidad biológica humana. La integración de capas ómicas es un procedimiento que se viene realizando habitualmente mediante protocolos diversos. Sin embargo, la conjunción de información de alta resolución molecular con datos no-ómicos resulta más problemática. En este trabajo se pretende realizar un análisis sistemático de las metodologías enfocadas hoy en día a la integración de capas ómicas con la correspondiente información clínica, epidemiológica o demográfica de los pacientes. Este proceso se lleva a cabo mediante el uso de aproximaciones bioestadísticas alternativas (métodos multivariantes, de regresión o de redes de similaridad) que son evaluadas en términos de su rendimiento. En cuanto al set de datos empleado, hemos escogido un proyecto de The Cancer Genome Atlas (TCGA) compuesto por alrededor de 180 muestras analizadas para varias capas ómicas y con una rica información clínica disponible. En concreto, nos hemos centrado en las vertientes de expresión génica (transcriptómica) y metilación (epigenómica). Nuestros resultados muestran una elevada heterogeneidad entre los diferentes métodos empleados, en términos del procedimiento de integración, de selección de variables (genes/variables clínicas) y de explotación de los datos. La naturaleza y comportamiento de la variable respuesta escogida ha podido afectar a los resultados obtenidos en nuestro estudio. Posteriores estudios, basados en diferentes datasets o en variables respuesta alternativas, podrían conseguir la construcción de modelos predictivos más robustos. Nowadays, using high-resolution biological data in a Biomedical context is essential. This molecular information, showed in different omics approaches (genomics, transcriptomics, proteomics, metabolomics), explains different sides of the human biological variability. Omics data integration is a procedure usually performed by different methods. However, the inclusion of high-resolution molecular information with non-omics data is more troubled. The aim of the present study is to perform a systematic analysis of the methodologies focused to omics and clinical/epidemiological/demographic information from patients, by the use of alternative biostatistics tests (multivariate, regression or similarity network methods) that are evaluated in terms of their performance. We chose a The Cancer Genome Atlas-TCGA project, composed by around 180 samples analyzed for several omics layers and with a rich clinical information available. Specifically, we focused on gene expression (transcriptomics) and methylation (epigenomics). Our results showed a high heterogeneity among the different methods used, regarding integration process, feature selection (genes/clinical variables) and data mining. The nature and behaviour of the selected outcome could affect the results drawn from the present work. Further studies, based on different datasets or alternative outcome variables, could reach the development of stronger predictive models. Avui dia resulta imprescindible l'ús de dades biològiques d'alta resolució en un àmbit Biomèdic. Aquesta informació molecular, expressada en diferents enfocaments òmics (genòmica, transcriptòmica, proteòmica, metabolòmica), explica diferents parcel·les de la variabilitat biològica humana. La integració de capes òmiques és un procediment que es realitza habitualment mitjançant protocols diversos. No obstant això, la conjunció d'informació d'alta resolució molecular amb dades no-òmics resulta més problemàtica. En aquest treball es pretén realitzar una anàlisi sistemàtica de les metodologies enfocades avui dia a la integració de capes òmiques amb la corresponent informació clínica, epidemiològica o demogràfica dels pacients. Aquest procés es duu a terme mitjançant l'ús d'aproximacions bioestadístiques alternatives (mètodes multivariants, de regressió o de xarxes de similitud) que són avaluades en termes del seu rendiment. Quant al set de dades emprat, hem triat un projecte de The Cancer Genome Atles (TCGA) compost per al voltant de 180 mostres analitzades per a diverses capes òmiques i amb una rica informació clínica disponible. En concret, ens hem centrat en els vessants d'expressió gènica (transcriptòmica) i metilació (epigenòmica). Els nostres resultats mostren una elevada heterogeneïtat entre els diferents mètodes emprats, en termes del procediment d'integració, de selecció de variables (gens/variables clíniques) i d'explotació de les dades. La naturalesa i comportament de la variable resposta triada ha pogut afectar els resultats obtinguts en el nostre estudi. Posteriors estudis, basats en diferents datasets o en variables resposta alternatives, podrien aconseguir la construcció de models predictius més robustos.
Details
- Language :
- Spanish; Castilian
- Database :
- OpenAIRE
- Journal :
- O2, repositorio institucional de la UOC, Universitat Oberta de Catalunya (UOC)
- Accession number :
- edsair.dedup.wf.001..1fd18a09eb64bbbd3f02fdc37f5fe8bd