Back to Search Start Over

Clasificación de imágenes de teledetección con técnicas de aprendizaje profundo en situaciones de escasez de datos

Authors :
Goldar Dieste, Álvaro
Argüello Pedreira, Francisco
Blanco Heras, Dora
Universidade de Santiago de Compostela. Escola Técnica Superior de Enxeñaría
Publication Year :
2022

Abstract

Traballo Fin de Máster en Computación de Altas Prestacións. Curso 2021-2022 Dentro del problema de clasificar imágenes multi e hiperespectrales, las técnicas basadas en aprendizaje profundo son las opciones más empleadas. El motivo es que son capaces de alcanzar mayores precisiones de clasificación que los métodos de aprendizaje automático tradicionales empleados anteriormente. Concretamente, las Redes Neuronales Convolucionales (CNN) han resultado ser la arquitectura más popular en la actualidad para resolver estos problemas de clasificación multiclase. No obstante, aunque las arquitecturas neuronales son herramientas muy efectivas, también requieren una gran cantidad de datos de aprendizaje para extraer todo su potencial. Además, los conjuntos de datos que se emplean en teledetección tienden a presentar dos grandes problemas: la escasez de datos anotados y el desbalance entre clases, de modo que ciertas clases de elementos tienen muchas más muestras que otras. Esta problemática limita la capacidad de los métodos de aprendizaje automático, y lo hace especialmente en las arquitecturas neuronales. Considerando lo común que es el proceso de clasificación en teledetección, resulta de gran interés encontrar vías para minimizar el impacto de las limitaciones de los conjuntos de datos y evitar perjudicar así el desempeño de los clasificadores basados en aprendizaje profundo que se emplean en la actualidad en este dominio. En este trabajo se propone un esquema de clasificación de imágenes de teledetección fundamentado en aprendizaje profundo, cuyo diseño ha sido guiado por el objetivo de minimizar el impacto de la escasez de muestras y desbalance de clases en los conjuntos de datos, para maximizar así la calidad de las clasificaciones realizadas. Para ello, se adopta como clasificador del esquema una arquitectura convolucional profunda –CNN residual–, al ser la base de los mejores clasificadores de la actualidad. El entrenamiento de esta red se apoya con técnicas de aumentado de datos. Por una parte, se aplican técnicas de aumentado tradicionales a las muestras de entrenamiento reales. Por otra parte, se integra la CNN residual en un esquema Generative Adversarial Networks (GAN), dentro del cual existe una red neuronal auxiliar que genere nuevas muestras sintéticas realistas que suministrar al clasificador durante el entrenamiento. Para mejorar la calidad de la información de entrenamiento, se aplica una etapa de segmentación en superpíxeles a la imagen como preprocesamiento, extrayéndose a posteriori una muestra real por cada segmento. Para maximizar la calidad de las clasificaciones generadas, se evalúa el comportamiento de las arquitecturas neuronales bajo una multitud de configuraciones diferentes, para identificar y preservar los criterios de diseño que les permiten alcanzar un mejor desempeño. También se aplican diversas optimizaciones computacionales para reducir todo lo posible el tiempo de entrenamiento del esquema desarrollado. Desde el punto de vista investigador, el interés de este trabajo radica en la combinación de diferentes técnicas que se habitúan emplear por separado en la literatura, ahora bajo un único esquema de clasificación. Además, se adoptará un diseño de GAN todavía no evaluado en el campo de la teledetección, que presenta mejoras en su estructura para alcanzar mejores desempeños en problemas que trabajen con conjuntos de datos limitados.

Details

Language :
Spanish; Castilian
Database :
OpenAIRE
Accession number :
edsair.od......1601..1107f51597df6c44efbed00a93409d27