1. Segmentation Sémantique d'Images de Télédétection Combinant Modèles Graphiques Probabilistes Hiérarchiques et Réseaux de Neurones Convolutifs Profonds
- Author
-
Martina Pastorino, Gabriele Moser, Serpico, Sebastiano B., Josiane Zerubia, Dipartimento di Ingegneria Navale, Elettrica, Elettronica e delle Telecomunicazioni / Dept. of Electrical, Electronic, Telecommunications Engineering and Naval Architecture (DITEN), Universita degli studi di Genova, Université Côte d'Azur (UCA), Télédetection et IA embarqués pour le 'New Space' (AYANA), Inria Sophia Antipolis - Méditerranée (CRISAM), Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), Centre National de la Recherche Scientifique [CNRS], ANR-15-IDEX-0001,UCA JEDI,Idex UCA JEDI(2015), Università degli studi di Genova = University of Genoa (UniGe), Institut de Recherche en Informatique de Toulouse (IRIT), and Institut national polytechnique de Toulouse (INP)
- Subjects
Télédétection ,[INFO.INFO-CV]Computer Science [cs]/Computer Vision and Pattern Recognition [cs.CV] ,multiresolution images ,semantic segmentation ,segmentation sémantique ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] ,[MATH.MATH-PR]Mathematics [math]/Probability [math.PR] ,remote sensing ,[INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,probabilistic graphical models ,réseaux de neurones convolutifs ,convolutional neural networks ,résolutions ,[INFO]Computer Science [cs] ,images multi ,images multi-résolutions ,modèles graphiques probabilistes - Abstract
International audience; In this paper, a novel method to tackle semantic segmentation of very high resolution remote sensing data is presented. Deep learning techniques, such as convolutional neural networks (CNNs) and fully convolutional networks (FCNs), have shown exceptional performances in this task. But the accuracy of their classification depends on the quantity and quality of the ground truth used to train them. On the other hand, probabilistic graphical models (PGMs) have sparked even more interest in the past few years, because of the ever-growing availability of very high resolution data and the correspondingly increasing need for structured predictions. The research themes proposed in this paper aim to link and combine different ideas of these approaches (deep learning and stochastic models) to develop new methods of classification of remote sensing images. In order to develop a pipeline combining deep learning and PGM to meet the growing need for precise semantic mapping in remote sensing images, two well-known deep learning architectures such as U-Net and SegNet were considered. The experimental validation was carried out with the “ISPRS 2D Semantic Labeling Challenge” data set on the city of Vaihingen, in some cases with some modifications, in order to approximate the ground truths common in real remote sensing applications, to assess whether the proposed method could improve the accuracy of classification in several cases. The results are significant, because the pipeline studied has a higher recall compared to the standard FCNs considered.; Dans cet article, une nouvelle méthode pour traiter la segmentation sémantique des données de télédétection à très haute résolution est présentée. Les progrès récents de l’apprentissage profond, en particulier les réseaux de neurones convolutifs et les réseaux entièrement convolutifs, ont montré des performances exceptionnelles dans cette tâche.Mais, comme pour les autres méthodes, la précision de la classification dépend de la quantité et de la qualité de la vérité de terrain utilisée pour les entraîner. Dans le même temps, les modèles de graphes probabilistes (PGMs) ont suscité beaucoup d’intérêt au cours des dernières années, en raison de la disponibilité toujours croissante des données à très haute résolution et, en conséquence, du besoin plus important de prévisions structurées. Les thèmes de recherche proposés dans cet article visent à relier et à combiner différents aspects de ces approches (modèles d’apprentissage profond et stochastiques) pour développer de nouvelles méthodes de classification d’images de télédétection.Afin de développer un pipeline mêlant apprentissage en profondeur et PGMs pour répondre au besoin croissant de cartographie sémantique précise dans les images de télé-détection, deux architectures d’apprentissage bien connues telles que U-Net et SegNet ont été considerées. La validation expérimentale est menée avec l’ensemble de données “ISPRS 2D Semantic Labelling Challenge” sur la ville de Vaihingen, dans certains cas avec quelques modifications.Ceci afin de simuler les vérités de terrain courantes dans les applications réelles de télédétection, pour évaluer si la méthode proposée pouvait apporter des améliorations à la précision de la classification. Les résultats sont significatifs, car le pipeline étudié a un score de “rappel” plus élevé par rapport aux réseaux entièrement convolutifs standard considérés
- Published
- 2021