Back to Search Start Over

Desarrollo de una herramienta para la identificación de pacientes crónicos complejos utilizado métodos estadísticos y algoritmos de aprendizaje automático

Authors :
Díaz Carnicero, Javier
Source :
RiuNet. Repositorio Institucional de la Universitat Politécnica de Valéncia, instname
Publication Year :
2018
Publisher :
Universitat Politècnica de València, 2018.

Abstract

[ES] Introducción El Sistema Nacional de Salud se está viendo afectado por el aumento de la cronicidad y el envejecimiento de la población, que se traduce en una mayor demanda de servicios. Los estudios y estratificación de la población según morbilidad se hacen necesarios para mejorar la gestión de los recursos. Los Pacientes Crónicos Complejos son un pequeño porcentaje de la población caracterizada por unas necesidades especialmente elevadas y una dificultad en su gestión. Su correcta identificación permitiría mejorar la atención que se les presta y su calidad de vida. Objetivo Desarrollo de una herramienta para la identificación de pacientes crónicos complejos utilizando métodos estadísticos y algoritmos de aprendizaje automático. Metodología El estudio se realiza sobre la población asignada de un departamento de salud, clasificada como crónico en el sistema Clinical Risk Groups (CRG) (estado de salud nivel 4 de CRG o superior) en el periodo de 2015 (98.465 pacientes). Se dispone de variables de tipo demográfico (edad y sexo), clínico (clasificación ACRG3, número de contactos ambulatorios, número de urgencias, número de ingresos, número de problemas relacionados con los medicamentos e importe de gasto farmacéutico) y socio-económico (zona básica de salud, situación de empadronamiento, indicador de nacionalidad , cobertura sanitaria, situación de residencia, migraciones, actividad laboral, grupos de aseguramiento, conjunto geopolítico, unidad de residencia, régimen de aportación de farmacia e índice de exclusión social). Para cada paciente se incluye una etiqueta de identificación de paciente crónico complejo marcada por profesionales sanitarios. Se plantea un análisis descriptivo de las variables, creación de modelos supervisados con tres sistemas de clasificación (random forest, regresión logística y red neuronal) y evaluación de los mismos con medida de exactitud, precisión, sensibilidad, especificidad, estadístico-F, coeficiente de correlación de Matthews y área bajo la curva ROC. Finalmente, se ha implementado el modelo obtenido con mejores resultados en una herramienta de visualización desarrollada con MATLAB. Resultados Las variables clínicas y de consumo de recursos están estrechamente ligadas al estado de salud y el nivel de gravedad de los pacientes. Entre las variables sociales, las más relevantes son el índice de exclusión social y la zona básica de salud. Tanto el algoritmo random forest como la red neuronal consiguen muy buenos resultados de clasificación con variables clínicas, pero el primero es el que ofrece mejor rendimiento al incorporar las variables socio-económicas. Este modelo se programa en una interfaz que permite obtener la probabilidad de un paciente de ser o no crónico complejo al introducir las variables. Conclusiones Los algoritmos de aprendizaje automático pueden ser usados para crear sistemas de clasificación de acuerdo con los criterios de los profesionales sanitarios. Las variables clínicas y socio-económicas permiten una correcta identificación de los pacientes crónicos complejos.<br />[CA] Introducció El Sistema Nacional de Salut s'està veient afectat per l'augment de la cronicitat i l'envelliment de la població, que es tradueix en una major demanda de serveis. Els estudis i estratificació de la població segons morbiditat es fan necessaris per a millorar la gestió dels recursos. Els Pacients Crònics Complexos són un petit percentatge de la població caracteritzada per unes necessitats especialment elevades i una dificultat en la seua gestió. La seua correcta identificació permetria millorar l'atenció que se'ls presta i la seua qualitat de vida. Objectiu Desenvolupament d'una eina per a la identificació de pacients crònics complexos utilitzant mètodes estadístics i algorismes d'aprenentatge automàtic. Metodologia L'estudi es realitza sobre la població assignada d'un departament de salut, classificats com a crònics en el sistema Clinical Risk Groups (CRG) (estat de salut nivell 4 de CRG o superior) en el període de 2015 (98.465 pacients). Es disposa de variables de tipus demogràfic (edat i sexe), clínic (classificació ACRG3, nombre de contactes ambulatoris, nombre d'urgències, nombre d'ingressos, nombre de problemes relacionats amb els medicaments i import de despesa farmacèutica) i soci-econòmic (zona bàsica de salut, situació d'empadronament, indicador de nacionalitat , cobertura sanitària, situació de residència, migracions, activitat laboral, grups d'assegurament, conjunt geopolític, unitat de residència, règim d'aportació de farmàcia i índex d'exclusió social). Per a cada pacient s'inclou una etiqueta d'identificació de pacient crònic complex marcada per professionals sanitaris. Es planteja una anàlisi descriptiva de les variables, creació de models supervisats amb tres sistemes de classificació (random forest, regressió logística i xarxa neuronal) i avaluació dels mateixos amb mesura d'exactitud, precisió, sensibilitat, especificitat, estadístic-F, coeficient de correlació de Matthews i àrea sota la corba ROC. Finalment, s'ha implementat el model obtingut amb millors resultats en una eina de visualització desenvolupada amb MATLAB. Resultats Les variables clíniques i de consum de recursos estan estretament lligades a l'estat de salut i el nivell de gravetat dels pacients. Entre les variables socials, les més rellevants són l'índex d'exclusió social i la zona bàsica de salut. Tant l'algorisme random forest com la xarxa neuronal aconsegueixen molt bons resultats de classificació amb variables clíniques, però el primer és el que ofereix millor rendiment en incorporar les variables soci-econòmiques. Aquest model es programa en una interfície que permet obtenir la probabilitat d'un pacient de ser o no crònic complex en introduir les variables. Conclusions Els algorismes d'aprenentatge automàtic poden ser usats per a crear sistemes de classificació d'acord amb els criteris dels professionals sanitaris. Les variables clíniques i soci-econòmiques permeten una correcta identificació dels pacients crònics complexos.<br />[EN] Introduction The National Health Service is affected nowadays by a raise in chronicity and ageing of the population, which turns into a higher demand of services. The studies and stratification of the population based on the morbidity condition have become necessary to improve the resource management. The complex chronic patients are a small percentage of the population, characterized by especially profound necessities and difficulties in their management. Their correct identification would improve the health care attention that is provided and also their life quality. Objective Development of a tool for complex chronic patients’ identification employing statistical methods and machine learning algorithms. Methodology The study was conducted with the assigned population of a health district, which is classified as chronic in the Clinical Risk Group (CRG) system (CRG equal or greater than 4) in 2015 (98,465 patients). The variables available are demographic (age and sex), clinical (ACRG3 classification, number of ambulatory events, number of visits to emergency departments, number of hospital admissions, pharmaceutical problems and ambulatory prescription costs) and socio-economical (basic health area, registration of residency, nationality, health coverage, residency situation, migrations, labour activity, assurance groups, geopolitical cluster, residency unit, pharmaceutical tax level and social exclusion index). There is also a complex chronic patient identification label for each patient, marked by sanitary professionals. A descriptive analysis of the variables is developed, and supervised learning models are created employing three classification algorithms (random forest, logistic regression and neural network). The evaluation is made through the measurement of accuracy, precision, recall, specificity, F-statistical, Matthews’ correlation coefficient and area under curve ROC. Finally, the model presenting the best performance is implemented in a visualization tool developed in MATLAB. Results The clinical variables and the information about resources consumption are highly related to the state of health and severity level of the patients. Among the social variables, the social exclusion index and the basic health areas prove to be the most significant ones. Both the random forest algorithm and the neural network offer great results, but the first one performs better when adding the socio-economic variables. This model is programmed in a user interface, to obtain the probability for a patient to be considered a complex chronic one by entering the different variables. Conclusions Machine learning algorithms can be used to develop classification systems, according to the professional criteria. The clinical and socio-economical variables provide a correct method to identify the complex chronic patients.

Details

Language :
Spanish; Castilian
Database :
OpenAIRE
Journal :
RiuNet. Repositorio Institucional de la Universitat Politécnica de Valéncia, instname
Accession number :
edsair.dedup.wf.001..11db55cad5182fc9055a4ea0614c2353