1. Prediction models for cardiovascular disease deaths using environmental variables and an exploratory study based on climate change scenarios
- Author
-
Bella, Thiago Ribas, 1992, Costa, Paula Dornhofer Paro, 1978, Boccato, Levy, Takahata, André Kazuo, Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação, Programa de Pós-Graduação em Engenharia Elétrica, and UNIVERSIDADE ESTADUAL DE CAMPINAS
- Subjects
Doenças cardiovasculares ,Mudanças climáticas ,Climate change ,Time series prediction ,Cardiovascular deaths ,Previsão de séries temporais - Abstract
Orientador: Paula Dornhofer Paro Costa Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação Resumo: As variáveis ambientais desempenham papel importante na saúde humana e as mudanças climáticas podem alterar essas relações. Atualmente, as doenças cardiovasculares (DCVs) são a principal causa de morte no mundo. Além do estilo de vida, as DCVs também sofrem influência de variáveis ambientais e estão sujeitas às mudanças climáticas. Para contribuir com a elaboração de estratégias de adaptação, mitigação e prevenção dos efeitos das mudanças climáticas, se faz necessário ferramentas capazes de simular diferentes cenários futuros, sobretudo de forma regionalizada. Assim, o objetivo geral deste trabalho é gerar e comparar modelos das associações entre variáveis ambientais e o número de mortes por DCVs para a cidade de Campinas, São Paulo. Ainda, propomos um estudo exploratório sobre o impacto de diferentes cenários de mudanças climáticas no número de óbitos por DCVs até 2050. Para isso, integramos e curamos bases de dados de óbitos e de variáveis ambientais. O banco de dados de óbitos por todas as causas foi fornecido pela Secretaria de Saúde de Campinas. O banco de dados das variáveis ambientais foram obtidos das estações meteorológicas da Companhia Ambiental do Estado de São Paulo, do Instituto Agronômico de Campinas, do Centro de Pesquisas Meteorológicas e Climáticas Aplicadas à Agricultura, e do Aeroporto Internacional de Viracopos. A base de dados ambientais inclui valores diários de temperatura, monóxido de carbono, material particulado, umidade relativa e pressão atmosférica. A partir dos dados integrados, desenvolvemos modelos preditivos utilizando duas abordagens distintas: regressão linear com erros SARIMA (LR-SARIMAX) e rede neural recorrente do tipo LSTM, para óbitos diários, semanais e mensais. Para alcançar os menores erro de predição, adotou-se a técnica de grid search, que variou sistematicamente os parâmetros intrínsecos dos modelos em conjunto com diferentes combinações das variáveis preditoras e da quantidade de lags dessas variáveis. Foram avaliados 441 modelos através das métricas RMSE e MAPE. Os modelos foram comparados em relação à periodicidade dos dados, ao tipo de modelo, às variáveis utilizadas e a quantidade de lags das variáveis. Os modelos utilizando dados mensais apresentaram erros de predição até 5 vezes menores que os modelos utilizando dados nas outras periodicidades. Apesar das diferentes abordagens não terem apresentado diferenças significativas nos erros de predição, a modelagem a partir do LR-SARIMAX apresentou mais vantagens que o LSTM, devido a sua robustez em relação a variação dos dados e sua capacidade de interpretabilidade. A temperatura desempenhou um papel importante nas predições de óbitos por DCVs, estando presente em 12 dos 15 melhores modelos. A quantidade de lags das variáveis preditoras também foi relevante nas predições, apresentando valores corroborados pela literatura. O estudo exploratório apontou que com o aumento das temperaturas mínimas, devido às mudanças climáticas, espera-se uma diminuição no número de óbitos por DCVs até 2050 para Campinas Abstract: Environmental variables play an important role in human health, and climate change can alter these relationships. Cardiovascular diseases (CVDs) are the leading cause of death in the world. In addition to lifestyle, CVDs are also influenced by environmental variables and are subject to climate change. To elaborate strategies for adaptation, mitigation, and prevention of the effects of climate change, tools capable of simulating different future scenarios are necessary, especially in a regionalized way. Thus, the general objective of this work is to generate and compare models of the associations between environmental variables and the number of deaths from CVDs in the city of Campinas, São Paulo. Furthermore, we propose an exploratory study on the impact of different climate change scenarios on the number of deaths from CVDs by 2050. We integrated and curated the databases of deaths from all causes from the Health Department of Campinas. The environmental variables were from the meteorological stations of the Environmental Company of the State of São Paulo, Agronomic Institute of Campinas, Center for Meteorological and Climatic Researches Applied to Agriculture, and Viracopos International Airport. The environmental database includes daily values for temperature, carbon monoxide, particulate matter, relative humidity, and atmospheric pressure. We developed predictive models from the integrated database using two approaches: linear regression with SARIMA errors (LR-SARIMAX) and LSTM recurrent neural network, for daily, weekly and monthly deaths. The grid search technique was adopted to achieve the smallest prediction errors. This technique systematically varies the intrinsic parameters of the models with different combinations of the predictor variables and the number of lags of these variables. Four hundred forty-one models were evaluated using the RMSE and MAPE metrics. The models were compared concerning the data periodicity, model type, variables combination, and the number of lags of environmental variables. The models using monthly data presented prediction errors up to 5 times smaller than the models using data in the other periodicities. Even though the different approaches did not show significant differences in prediction errors, the LR-SARIMAX modeling presented more advantages than the LSTM due to its robustness in relation to data variation and its ability to interpret. The temperature was essential in predicting deaths from CVDs, being present in 12 of the 15 best models. The number of lags of the predictor variables was also relevant in the predictions, presenting values corroborated by the literature. The exploratory study pointed out that with the increase in minimum temperatures due to climate change, a decrease in the number of deaths from CVDs is expected by 2050 for Campinas Mestrado Engenharia de Computação Mestre em Engenharia Elétrica CNPQ 130089/2021-4
- Published
- 2022