Orientador: Prof. Dr. Carlos Alberto Kamienski Tese (doutorado) - Universidade Federal do ABC, Programa de Pós-Graduação em Engenharia da Informação, Santo André, 2021. Nos últimos anos, o desenvolvimento e a popularização da Internet das Coisas (IdC) permitiram dados espaço-temporalmente mais granulares para a agricultura, o que favoreceu o avanço das abordagens baseadas em dados e o aprofundamento da agricultura de precisão. Nesse contexto, este trabalho investiga e contribui para o estado da arte especificamente da estimativa da necessidade de água para irrigação de precisão baseada em IdC. Para isso, primeiro fazemos um levantamento da área e cada um de seus assuntos principais, construímos um mapa em forma de gráfico para orientar os designers de soluções e investigamos e extrapolamos as tendências de pesquisa. Depois, reconhecemos que a qualidade dos dados é um problema para as abordagens de aprendizado de máquina aplicadas aos dados de IdC, discutindo possíveis soluções. Finalmente, testamos a viabilidade de abordagens de aprendizado de máquina para estimativa de necessidade de água com base na previsão de umidade do solo em um caso real com um histórico de dois a quatro anos de doze campos, alocados em quatro fazendas de diversas características geográficas e climáticas, com 55 safras de oito diferentes tipos de colheita. Em vez de um único valor, prevemos os valores mínimo e máximo dos dias seguintes como variáveis-resposta para monitorar riscos de valores extremos de umidade do solo. Além disso, modelar a umidade do solo diretamente é melhor do que modelar o potencial matricial do solo para posteriormente converter em umidade do solo. Testamos vários algoritmos e descobrimos que o LightGBM supera regressão linear, árvore de decisão, floresta aleatória, perceptron multicamadas, LSTM e StemGNN. Além disso, a combinação de previsões via conjunto de algoritmos fornece um ganho de precisão adicional. Para treinamento de modelo e medição de precisão, usamos conjuntos de dados ponderados para privilegiar pontos de dados raros, mas críticos. Mostramos que a previsão da umidade do solo atinge seu desempenho máximo considerando apenas a umidade anterior do solo, um índice baseado no contexto e a previsão de precipitação. Consequentemente, as variáveis tradicionais de conhecimento de domínio - como evapotranspiração, fenologia da cultura e comportamento hidráulico do solo - não são relevantes para melhorar o desempenho de previsão de umidade do solo. Assim, nosso trabalho sugere abordagens totalmente baseadas em dados para estimativa da necessidade de água de irrigação, observando alguns cuidados em relação à qualidade dos dados. Este trabalho é uma junção de quatro artigos, um por capítulo, ordenados e harmonizados entre eles. In recent years, the development and popularization of the Internet of Things (IoT) have allowed spatial-temporal fine-grained data for agriculture, which favored the advancement of datadriven approaches and the deepening of precision agriculture. In this context, this work investigates and contributes to state-of-the-art specifically in water need estimation for IoTbased precision irrigation. For that, we first survey the area and each of their key subjects, build up a graph-shaped map to guide solution designers, and investigate and extrapolate research trends. After, we recognize that data quality is an issue to machine learning approaches applied to IoT data, addressing possible solutions. Finally, we test the feasibility of machine learning approaches to water need estimation based on soil moisture (SM) forecast in a real case with a two-to¿four-year history of twelve fields from four farms of diverse geographic and climatic characteristics, with 55 crops from eight different crop types. We also provide a guide for machine learning-based soil moisture forecast modeling. Instead of a single value, we predict the following days' minimum and maximum values as targets to monitor risks of extreme soil moisture values. Furthermore, modeling soil moisture directly in volumetric water content (VWC) is better than modeling soil matric potential (SMP) to later convert in soil moisture VWC. We test several algorithms and find out that LightGBM outperforms linear regression, decision tree, random forest, multilayer perceptron, LSTM, and StemGNN. Also, blending predictions via algorithm ensemble provides an additional accuracy gain. For model training and accuracy measurement, we use weighted datasets to privilege rare but critical data points. We show that soil moisture forecast reaches its maximum performance considering only past soil moisture, a context-aware index, and a precipitation forecast. Consequently, traditional domain knowledge features - such as evapotranspiration, crop phenology, and soil hydraulic behavior - are not relevant to improving SM forecast performance. Thus, our work suggests full data-driven approaches for irrigation water need estimation, observed some care regarding data quality. This work is an ensemble of four papers, one per chapter, ordered and harmonized among them.