Back to Search Start Over

Optimización de búsquedas en grandes conjuntos de datos mediante la utilización de algoritmos de clustering con preservación de la topología

Authors :
Ruiz Fernández, Daniel
Universidad de Alicante. Departamento de Tecnología Informática y Computación
Quintana Pacheco, Yuri
Ruiz Fernández, Daniel
Universidad de Alicante. Departamento de Tecnología Informática y Computación
Quintana Pacheco, Yuri
Publication Year :
2013

Abstract

En la presente investigación se propone un método para realizar búsquedas en grandes conjuntos de datos con características similares a los grafos. El método está dividido en dos etapas: una etapa de organización del conjunto de datos y una etapa donde se puede realizar la búsqueda de elementos que minimicen una función objetivo según el modelo organizativo obtenido. Para la organización del conjunto de datos se propone el empleo del algoritmo growing neural gas, al que se le han incorporado modificaciones que facilitan su empleo en el contexto de la investigación. El método de grafos embebidos en espacios vectoriales se utiliza para obtener representaciones de los elementos del conjunto de datos apropiadas para la aplicación del algoritmo de clustering. Como resultado del proceso de organización cada elemento del conjunto de datos es asociado a un nodo del modelo obtenido de la aplicación del algoritmo de clustering. Para la etapa de búsqueda se propone un algoritmo basado en la heurística simulated annealing. El algoritmo realiza estimaciones de la calidad de los elementos asociados a cada nodo del modelo mediante evaluaciones de la función objetivo que realiza mientras se recorre el modelo. Estas estimaciones son empleadas para orientar la búsqueda. El funcionamiento de cada etapa de la propuesta de solución es validada de forma empírica mediante el empleo de conjuntos de datos y funciones objetivo seleccionados con este fin. Los resultados de la aplicación del método general propuesto muestran que la obtención de soluciones requiere la evaluación de un pequeño porcentaje de los elementos del conjunto de datos, de modo que se reducen los tiempos asociados al proceso de búsqueda.

Details

Database :
OAIster
Publication Type :
Electronic Resource
Accession number :
edsoai.ocn950502225
Document Type :
Electronic Resource