Back to Search Start Over

Дослідження впливу шуму в напівкерованому навчанні

Authors :
Victor Sineglazov
Kyrylo Lesohorskyi
Source :
Electronics and Control Systems; Vol. 1 No. 71 (2022); 9-15, Электроника и системы управления; Том 1 № 71 (2022); 9-15, Електроніка та системи управління; Том 1 № 71 (2022); 9-15
Publication Year :
2022
Publisher :
National Aviation University, 2022.

Abstract

The article deals with the problem of noise effect on semi-supervised learning. The goal of this article is to analyze the impact of noise on the accuracy of binary classification models created using three semi-supervised learning algorithms, namely Simple Recycled Selection, Incrementally Reinforced Selection, and Hybrid Algorithm, using Support Vector Machines to build a base classifier. Different algorithms to compute similarity matrices, namely Radial Bias Function, Cosine Similarity, and K-Nearest Neighbours were analyzed to understand their effect on model accuracy. For benchmarking purposes, datasets from the UCI repository were used. To test the noise effect, different amounts of artificially generated randomly-labeled samples were introduced into the dataset using three strategies (labeled, unlabeled, and mixed) and compared to the baseline classifier trained with the original dataset and the classifier trained on the reduced-size original dataset. The results show that the introduction of random noise into the labeled samples decreases classifier accuracy, while a moderate amount of noise in unmarked samples can have a positive effect on classifier accuracy. В статье рассматривается проблема влияния шума на точность в задачах полууправляемого обучения. Целью этой статьи является анализ влияния шума на точность моделей, созданных с помощью трех полууправляемых алгоритмов обучения, а именно: Simply Recycled Selection (SRS), Incrementally Reinforced Selection (IRS) и Hybrid Algorithm (HYB). В качестве базового классификатора использован Support Vector Machine (SVM). Проанализированы различные алгоритмы для вычисления матриц подобия, а именно Radial Bias Function, Cosine Simmilarity и K-Nearest Neighbours. Для целей сравнительного анализа будут использоваться наборы данных из хранилища UCI. Чтобы проверить влияние шумов, различные количества искусственно сгенерированных случайно размеченных образцов были введены в набор данных с использованием трех стратегий (размеченные, неразмеченные, смешанные) и сравнены с базовым классификатором, обученным исходным набором данных, и классификатором, обученным на исходном наборе данных уменьшенного размера. Результаты показывают, что ввод случайного шума в маркированные образцы ухудшает точность модели, а ввод случайного шума в немаркированные данные может наоборот повысить точность модели. У статті розглядається проблема впливу шуму на точність у задачах напівккерованого навчання. Метою цієї статті є аналіз впливу шуму на точність моделей бінарної класифікації, створених за допомогою трьох напівкерованих алгоритмів навчання, а саме: Simply Recycled Selection (SRS), Incrementally Reinforced Selection (IRS) і Hybrid Algorithm (HYB). У якості базового класифікатора використано Support Vector Machine (SVM). Ми проаналізуємо різні алгоритми для обчислення матриць подібності, а саме Radial Bias Function, Cosine Simmilarity і K-Nearest Neighbours. Для цілей порівняльного аналізу використовуватимуться набори даних зі сховища UCI. Щоб перевірити вплив шуму, різна кількість штучно згенерованих випадково позначених зразків було введено в набір даних з використанням трьох стратегій (маркована, не маркована та змішана) і порівняно з базовим класифікатором, навченим з вихідним набором даних, і класифікатором, навченим на вихідному наборі даних зменшеного розміру. Результати показують, що введення випадкового шуму в марковані зразки погіршує точність моделі, а введення випадкового шуму в немарковані дані може навпаки підвищити точність моделі. Ключові слова: зашумлені данні; машинне навчання; напівкероване навчання; опорні векторні машини.

Details

ISSN :
19905548
Volume :
1
Database :
OpenAIRE
Journal :
Electronics and Control Systems
Accession number :
edsair.doi.dedup.....cdf1b6adfff0bcd3c24cdcc2d086d5da