Back to Search
Start Over
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
- Source :
- Repositório Institucional da UFRN, Universidade Federal do Rio Grande do Norte (UFRN), instacron:UFRN
- Publication Year :
- 2021
- Publisher :
- Universidade Federal do Rio Grande do Norte, 2021.
-
Abstract
- O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada, sendo possível duas vertentes: classificação semissupervisionada e agrupamento semissupervisionado. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado. Utilizando um deep autoencoder transformou-se os dados para um espaço de características Z e a partir disso agrupou-se e rotulou-se esses dados, com auxílio dos dados rotulados. Aplicou-se técnicas de Aprendizado por Teoria da Informação para aumentar a robustez do modelo proposto neste trabalho. Experimentos realizados apontaram a eficiência do modelo proposto em rotular e classificar dados a após o treinamento. Comparou-se também o com outros modelos clássicos de aprendizado semissupervisionado, como co-training, tri-training, STRED e SEEDED K-means, bem como outros trabalhos mais recente, mostrando a viabilidade do modelo proposto para o problema de aprendizagem semissupervisionada. E por fim, aplicou-se o modelo em um problema real na área de sensoriamento remoto e classificação de dados de stream. The expressive growth of modern data sets, combined with the difficulty of obtaining information about labels, has made semi-supervised learning one of the problems of practical importance in modern data analysis. In most cases, obtaining a dataset with enough examples to induce a classifier can be costly, as it is necessary to perform labeling of the data by an expert. Unlabeled data is easier to obtain but more difficult to analyze and interpret. In the semi-supervised learning problem, there is a database formed by a small labeled part and a larger unlabelled part, with two possible aspects: semi-supervised classification and semi-supervised clustering. With this, this work aims to apply models that use deep learning techniques in semi-supervised learning. Using a deep autoencoder, the data was transformed to feature space Z, and, from that, these data were clustered and labeled, with the help of the labeled data. Information Theory Learning techniques were applied to increase the robustness of the model proposed in this work. Experiments performed showed the proposed model efficiency in labeling and classifying data after training. It was also compared to other classic semi-supervised learning models, such as co-training, tri-training, STRED and SEEDED K-means, as well as other more recent works, showing the proposed model feasibility for the semi-supervised learning problem. Finally, the model was applied to a real problem in remote sensing problem and stream data classification.
Details
- Language :
- Portuguese
- Database :
- OpenAIRE
- Journal :
- Repositório Institucional da UFRN, Universidade Federal do Rio Grande do Norte (UFRN), instacron:UFRN
- Accession number :
- edsair.od......3056..99307d4da1b05303c91641bd61490d63