Back to Search Start Over

Método rápido de preprocesamiento para clasificación en conjuntos de datos no balanceados

Authors :
William Cruz-Santos
Liliana Puente-Maury
Lourdes López-García
Asdrúbal López-Chau
Source :
Research in Computing Science. 73:129-142
Publication Year :
2014
Publisher :
Instituto Politecnico Nacional/Centro de Investigacion en Computacion, 2014.

Abstract

Resumen. El problema de desbalance en clasificacion se presenta en conjuntos de datos que tienen una cantidad grande de datos de cierto tipo (clase mayoritaria), mientras que el numero de datos del tipo contrario es considerablemente menor (clase minoritaria). En este escenario, practicamente todos los metodos de clasificacion presentan un bajo desempeno. En este articulo se propone un nuevo metodo de preprocesamiento, que utiliza un enfoque similar a las tecnicas de basadas en enlaces Tomek, pero cuyo tiempo de ejecucion es dramaticamente reducido con respecto al calculo por fuerza bruta, comunmente utilizado en dichas tecnicas. Los resultados obtenidos en los experimentos demuestran la efectividad del metodo propuesto para mejorar las areas de las curvas ROC y PRC de metodos de clasificacion aplicados a conjuntos de datos reales no balanceados.

Subjects

Subjects :
General Medicine

Details

ISSN :
18704069
Volume :
73
Database :
OpenAIRE
Journal :
Research in Computing Science
Accession number :
edsair.doi...........e72250ac80eab5dc75d8728e3c51a087
Full Text :
https://doi.org/10.13053/rcs-73-1-9