1. Aplicação de algoritmos de aprendizado de máquina à análise de concentrações de MP2,5 no Estado de São Paulo, Brasil
- Author
-
Godoy, Angela Rosa Locateli, Silva, Ana Estela Antunes da, Bueno, Mirelle Candida, Pozza, Simone Andréa, Coelho, Guilherme Palermo, Godoy, Angela Rosa Locateli, Silva, Ana Estela Antunes da, Bueno, Mirelle Candida, Pozza, Simone Andréa, and Coelho, Guilherme Palermo
- Abstract
Dados de monitoramento da qualidade do ar são úteis em diferentes áreas de pesquisa e aplicações, como por exemplo, no estudo da relação da poluição do ar com problemas respiratórios e outros prejuízos à saúde. Dentre os principais poluentes atmosféricos estão: ozônio (O3), dióxido de enxofre (SO2), monóxido de carbono (CO), dióxido de nitrogênio (NO2) e material particulado (MP). O MP é um dos principais objetos de estudos quando se pretende proteger as pessoas da exposição a poluentes. O presente trabalho contribui com a análise da concentração do poluente MP2,5, em 21 estações de monitoramento, observadas pela CETESB - Companhia Ambiental do Estado de São Paulo. Este estudo emprega mineração de dados por agrupamento, um método proeminente para reconhecer padrões e descobrir semelhanças, aspectos importantes para avaliar a poluição do ar, principalmente em uma área geograficamente vasta como o estado de São Paulo, que não segue um único padrão. A técnica de mineração por regras de associação, também aplicada, oferece suporte na análise da relação de poluentes com variáveis meteorológicas, por permitir identificar associações entre elementos que ocorrem juntos, em uma grande variedade de dados. Os objetivos incluem identificar estações com comportamentos semelhantes e explorar a variedade temporal do poluente relacionada aos fatores meteorológicos dominantes nos períodos de alta concentração. O algoritmo de agrupamento, separa de forma automática as estações a partir de médias mensais de concentração de MP2,5 nos anos de 2017 a 2019. Os grupos de estações com maiores índices encontrados do poluente foram os centros urbanos, com emissões por indústrias e veículos e, as estações com índices menores foram as localizadas mais ao interior do estado. Também houve a identificação de um ciclo sazonal nas variações do poluente nos três anos para os dois gr, Air quality monitoring data are useful in different areas of research and have varied applications, especially with a focus on the relationship between air pollution, respiratory problems, and other health hazards. The main atmospheric pollutants are: ozone (O3), sulfur dioxide (SO2), carbon monoxide (CO), nitrogen dioxide (NO2), and particulate matter (PM). PM is one of the main objects of study when one intends to protect people from exposure to pollutants. This study contributes to the analysis of PM2.5 in 21 stations in the state of São Paulo monitored by the Environmental Company of São Paulo State (CETESB). It employs cluster analysis, a prominent data mining method for detecting patterns and discovering similarities which is important for assessing air pollution, especially in a geographically vast area such as that of the state of São Paulo, which does not follow a single pattern. Another data mining technique (association rules) supports the analysis of the relationship between pollutants and meteorological variables, as it allows identifying changes between elements that occur together, in a wide variety of data. Our objectives include determining stations with similar behaviors and exploring the temporal variety of the pollutant as it relates to the dominant meteorological factors in the periods of high concentration. The clustering algorithm automatically separates stations according to their monthly averages of PM2.5 concentration between 2017 and 2019. The clusters of stations that showed the highest pollution rates essentially included urban centers with emissions by industries and vehicles, while those with the lowest rates were located further inland. A cyclical behavior in pollutant variation was also observed in the three years under study and for both clusters. For the months with the highest concentration of PM2.5, association
- Published
- 2021