Justina, Diego Domingos Della, 1987, Rocha, Jansle Vieira, 1961, Lamparelli, Rubens Augusto Camargo, 1955, Rolim, Glauco de Souza, Johann, Jerry Adriani, Rodrigues, Luiz Henrique Antunes, Magalhães, Paulo Sergio Graziano, Universidade Estadual de Campinas. Faculdade de Engenharia Agrícola, Programa de Pós-Graduação em Engenharia Agrícola, and UNIVERSIDADE ESTADUAL DE CAMPINAS
Orientadores: Jansle Vieira Rocha, Rubens Augusto Camargo Lamparelli Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola Resumo: O rendimento da cana-de-açúcar é determinado não apenas pelo peso fresco, mas também pelo teor de açúcar. O conhecimento prévio sobre o teor açúcar (Brix) é imperativo para determinar a maturidade da planta e, consequentemente, a produtividade de seus derivados, ou seja, açúcar e etanol. Os sistemas de decisão baseados em dados têm sido amplamente adotados pela indústria da cana-de-açúcar. No entanto, as usinas ainda dependem de métodos como levantamentos de campo para determinar os parâmetros de produtividade, como o Brix. Devido à extensão da área cultivada e à baixa acessibilidade das áreas cultivadas, devido à densidade populacional de plantas, o levantamento de campo é considerado um método muito ineficiente. Muitas iniciativas de monitoramento concentram-se no uso de modelos de crescimento para estimativas de rendimento, mas são difíceis de aplicar em estimativas regionais devido à disponibilidade de dados e limitações relacionadas ao próprio modelo. Pesquisas utilizando modelos empíricos construídos usando técnicas de aprendizado de máquina mostraram bom desempenho em estimativas de produtividade de cana-de-açúcar, podendo ser uma alternativa viável aos modelos de crescimento, mas a dependência de múltiplas fontes de dados dos modelos empíricos é uma grande desvantagem. Devido à sua capacidade de estimar parâmetros biofísicos da vegetação em escalas regionais, o sensoriamento remoto é considerado uma ferramenta valiosa para o monitoramento das áreas cultivadas. Por esse motivo, investigamos a viabilidade da estimativa do Brix através da resposta espectral da cana obtida de sensores orbitais. Para este fim, avaliamos o desempenho preditivo de modelos de regressão construídos usando dados de reflectância multiespectral, derivados de sensores de satélite e valores Brix obtidos a partir de observações terrestres. Também avaliamos a correspondência entre os dados espectrais e os processos fisiológicos da cana-de-açúcar relacionados ao acúmulo de açúcar, para avaliar a capacidade do sensoriamento remoto de estimar parâmetros biofísicos. Dado o grande número de plataformas de sensoriamento remoto, foram testados dois sensores de satélite, o RapidEye Multi Spectral Imager (MSI) e o LANDAT-8 Operational Land Imager (OLI), cada um com diferentes características de resolução espectral, espacial e temporal. O desempenho dos dados dos sensores MSI e OLI resultou em um erro absoluto médio (MAE) de 0,315 e 0,376, respectivamente, indicando nenhuma diferença significativa entre os sensores. Comparando com o desempenho de uma abordagem tradicional, que é simplesmente predizer o Brix do valor de Brix médio observado (0,621), o MAE de ambos os sensores foi significativamente menor. Como os modelos empíricos baseados em dados espectrais foram mais precisos, o uso de dados de sensoriamento remoto é viável para estimar a qualidade da cana-de-açúcar. Múltiplas funções de transferência foram modeladas empiricamente usando várias técnicas de aprendizado de máquina que usam dados espectrais para prever a variação Brix na área da Usina São João para as safras 2013 - 2016. O desempenho dos modelos foi avaliado entre as técnicas usando métricas com base em métricas de resíduo e de ranqueamento. De acordo com a avaliação dos resíduos, o MAE dos variaram de 1,274 a 1,282. Seus desempenhos ficaram próximos a um modelo nulo MAE de 1,414, o que corresponde a prever o Brix utilizando a média dos dados observados. De acordo com a métrica de ranqueamento, o desempenho do modelo variou de um coeficiente de GINI de 0,512 a 0,707, mostrando melhora clara em comparação com um modelo nulo GINI de 0,204. Nossos resultados indicam que dados espectrais podem ser usados para estimar o conteúdo de Brix de cana-de-açúcar Abstract: Sugarcane yield is determined not only by fresh weight but also by the sugar content. Foreknowledge about sugar content (Brix) is imperative to determine the plant maturity and, consequently, the productivity of its derivates, i.e., sugar and ethanol. Data driven decision-make systems have been widely adopted by the sugarcane industry. Mills still relies on methods such as field surveys determine the quality parameters such as Brix. Due to the extension of the cultivated area and the poor intra-field accessibility because of dense plant population, field survey is considered very inefficient method. Many monitoring initiatives focus on the use of growth models for yield estimations, but they are difficult to apply in regional estimates due to data availability and limitations related to the model itself. Alternatively, research using empirical models built using machine learning techniques have shown good performance on sugarcane yield estimations, but the dependence of multiple data sources is a major drawback. Because of its capabilities of retrieving vegetation biophysical parameters at regional scales, remote sensing is considered a valuable tool for crop field surveillance. For this reason, we investigated the feasibility of retrieving Brix information from sugarcane spectral response obtained from spaceborne platforms. To this end we evaluated the predictive performance of regression models built using multispectral reflectance data, derived from satellite sensors and Brix values obtained from ground-based observations. We also evaluated the correspondence between spectral data and sugarcane physiological processes related to sugar accumulation, to ensure the remote sensing capabilities of retrieving biophysical parameters. Given the large number of available remote sensing platforms, we tested two satellite sensors, the RapidEye Multi Spectral Imager (MSI) and the Landsat-8 Operational Land Imager (OLI), each one with different set characteristics regarding spectral, spatial and temporal resolutions. The performance of MSI and OLI sensors data resulted in a mean absolute error (MAE) of 0.315 and 0.376 respectively, indicating no significant difference between sensors. Comparing to the performance of a traditional approach, which is simply predicting the Brix from average Brix value observed (0.621), MAE from both sensors was significantly smaller. Since the empirical models based on spectral data were more accurate, the use of remote sensing data is feasible to estimate sugarcane quality. Multiple transfer functions were modeled empirically using multiple machine learning techniques that use spectral data to predict Brix variation in the São João Mill area for the 2013 - 2016 crop seasons. The performance of the models was evaluated across techniques using both residual-based and ranking-based metrics. According to the residual-based, the models mean absolute error (MAE) ranged from 1.274 to 1.282. Their performances were close to a null model MAE of 1.414, which corresponds to predicting the Brix using the average of the overserved data. According to the ranking-based metric, the model¿s performance ranged from a GINI coefficient of 0.512 to 0.707, showing clear improvement compared to a null model GINI of 0.204. Our results indicate that spectral data can be used to estimate sugarcane Brix content Doutorado Gestão de Sistemas na Agricultura e Desenvolvimento Rural Doutor em Engenharia Agrícola CNPQ 142349/2014-3