Arlandis Navarro, Joaquim Francesc, Arnal Benedicto, Laura, Universitat Politècnica de València. Departamento de Informática de Sistemas y Computadores - Departament d'Informàtica de Sistemes i Computadors, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, Galdón Arnandis, Adrià, Arlandis Navarro, Joaquim Francesc, Arnal Benedicto, Laura, Universitat Politècnica de València. Departamento de Informática de Sistemas y Computadores - Departament d'Informàtica de Sistemes i Computadors, Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica, and Galdón Arnandis, Adrià
[CA] La diabetis de tipus 2 (DMT2) causa un augment important i precoç de la mortalitat i una reducció de la qualitat de vida dels pacients. El component genètic de la DMT2 suposa més del 50%, però en la seua major part no està identificat. Els estudis de les variacions presents en l’exoma i les seues interaccions juntament amb altres factors com els clínics, antropomètrics i ambientals, permeten la identificació de biomarcadors implicats en aquesta malaltia. A partir d’aquests factors influents és possible establir models predictius que permeten identificar les persones que tenen un major risc de desenvolupar la malaltia i, amb això, prendre mesures preventives eficaces per a evitar-la. L’objectiu del present treball serà la creació i avaluació de models predictius de la DT2 a partir d’una sèrie d’hipòtesis de biomarcadors, genètics (SNP) o no (clínics, perfils bioquímics, antropomètrics, o ambientals) associats a la malaltia. S’utilitzaran dades reals extretes d’una població d’individus. Es partirà d’una o diverses hipòtesis de biomarcadors, es parametritzaran i avaluaran diversos algorismes per a quantificar la seua capacitat per a pronosticar i, finalment, es presentaran resultats de predicció per a cadascun d’ells. Es provaran predictors que han demostrat bones prestacions amb dades de biomarcadors com són random forest, particularment la implementació Gradient Boosting. Els ’targets’ (variable dependent que es vol predir) podran ser de tipus cas/control (persona malalta/sana). Els resultats es presentaran en els formats habitualment usats pels professionals mèdics com són les corbes ROC., [EN] Type 2 diabetes (T2D) causes a significant and early increase in mortality and a reduction in the quality of life of patients. The genetic component of T2D accounts for over 50%, but most of it remains unidentified. Studies on variations present in the exome and their interactions, along with other factors such as clinical, anthropometric, and environmental factors, allow the identification of biomarkers involved in this disease. Based on these influential factors, it is possible to establish predictive models that identify individuals at higher risk of developing the disease, enabling the implementation of effective preventive measures. The objective of this study will be the creation and evaluation of predictive models for T2D using a series of biomarker hypotheses, whether genetic (SNPs) or non-genetic (clinical, biochemical, anthropometric, or environmental profiles) variables associated with the disease. Real data extracted from a population of individuals will be utilized. We will start with one or multiple biomarker hypotheses, parameterize and evaluate various algorithms to quantify their prognostic capacity, and finally present prediction results for each of them. Predictors that have demonstrated good performance with biomarker data, such as random forest, particularly the Gradient Boosting implementation will be tested. The targets (dependent variables to be predicted) may be of case/control type (sick/healthy individuals). The results will be presented in formats commonly used by medical professionals, such as ROC curves., [ES] La diabetes tipo 2 (DT2) causa un aumento importante y precoz de la mortalidad y una reducción de la calidad de vida de los pacientes. El componente genético de la T2D supone más del 50 %, pero en su mayoría no está identificado. Los estudios de las variaciones presentes en el exoma y sus interacciones junto con otros factores como los clínicos, antropométricos y ambientales, permiten la identificación de biomarcadores implicados en esta enfermedad. A partir de estos factores influyentes es posible establecer modelos predictivos que permiten identificar a las personas que tienen un mayor riesgo de desarrollar la enfermedad y, con ello, tomar medidas preventivas eficaces para evitarla. El objetivo del presente trabajo será la creación y evaluación de modelos predictivos de la DT2 a partir de una serie de hipótesis de biomarcadores, genéticos (SNP) o no (clínicos, perfiles bioquímicos, antropométricos o ambientales) asociados a la enfermedad. Se utilizarán datos reales extraídos de una población de individuos. Se partirá de una o varias hipótesis de biomarcadores, se parametrizarán y evaluarán diversos algoritmos para cuantificar su capacidad para pronosticar y, finalmente, se presentarán resultados de predicción para cada uno de ellos. Se probarán predictores que han demostrado buenas prestaciones con datos de biomarcadores como son random forest, particularmente la implementación Gradient Boosting. Los ’targets’ (variable dependiente que se quiere predecir) podrán ser de tipo caso/control (persona enferma/sana). Los resultados se presentarán en los formatos habitualmente utilizados por los profesionales médicos como son las curvas ROC.