Descriptor: "SUPPORT vector machines" / Database: OpenAIRE / Language: spanish; castilian - Searchworks@Jio Institute Digital Library Search Results

Your search keyword '"SUPPORT vector machines"' showing total 53 results

Start Over Descriptor "SUPPORT vector machines" Language spanish; castilian Database OpenAIRE

53 results on '"SUPPORT vector machines"'

1. Características del hogar y pobreza : una aplicación de las máquinas de soporte vectorial

Author: Rahmer, Bruno de Jesús, Garzón Saénz, Hernando, Ortiz Piedrahita, Gustavo, and Solana Garzón, José
Subjects: learning algorithm, classification methods, pobreza, poverty, hogares censales, métodos de clasificación, máquinas de soporte vectorial, algoritmo de aprendizaje, household data, support vector machines
Abstract: El uso de técnicas cuantitativas para la clasificación de segmentos poblacionales es una fase crítica para evaluar sus condiciones de materiales de existencia, información que sirve como input para los procesos de planificación de estrategias dirigidas a paliar la pobreza y la intervención discrecional de tales grupos, bajo los criterios de racionalidad económica e instrumental. En este artículo se construye un modelo de máquinas de soporte vectorial, entendido éste como un algoritmo de aprendizaje supervisado que proporciona un clasificador lineal no probabilístico con un superlativo nivel de precisión. De este modo, se segmenta una muestra de núcleos familiares residentes en Cartagena de Indias, en función de ciertas variables económicas y sociodemográficas. La obtención de los resultados analíticos refrenda el hecho de que los factores con mayor poder de discriminación entre los agentes económicos son el estatus laboral, la accesibilidad a servicios públicos y la renta percibida por los núcleos familiares. Por otra parte, se corrobora que las condiciones de vecindario y la recepción de transferencias monetarias corrientes tienen un poder clasificatorio reducido., The use of quantitative techniques for the classification of population segments is a critical phase to evaluate their conditions. This information will serve as input for planning strategies to alleviate poverty. In this article, we present a model of vector support machines. Consequently, a sample of families residing in Cartagena de Indias is segmented, based on certain economic and sociodemographic variables. Analytical results confirm that most important factors are employment status, accessibility to public services and familiar income. In addition, it is corroborated that neighborhood conditions and monetary transfers have a low discriminatory power., Universidad Pablo de Olavide
Published: 2023

2. Contributions to perturbation analysis using machine learning and time-frequency analysis

Author: Miramont, Juan Manuel, Schlotthauer, Gastón, Torres, Humberto Maximiliano, Vanrell, Sebastián Rodrigo, Gómez, Juan Carlos, and Martínez, César
Subjects: Máquinas de vectores de soporte, Jitter relativo vocal, Support vector machines, Synchrosqueezing operators, Voice perturbation analisys, Operadores de synchrosqueezing, Análisis de perturbaciones, Voice relative jitter
Abstract: Fil: Miramont, Juan Manuel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina. Las perturbaciones en la señal de la voz son pequeñas modificaciones de corto plazo en parámetros de la señal, cuya cuantificación resulta de importancia para el diagnóstico de patologías laríngeas, nerviosas o respiratorias. Las medidas utilizadas con este fin requieren cierta periodicidad de la señal y suelen ser insensibles a a grandes fluctuaciones de los parámetros medidos, como la duración de los ciclos. En esta tesis se presenta, en primer lugar, una herramienta para la clasificación automática de voces basada en máquinas de vectores de soporte con el objetivo de evitar la cuantificación de perturbaciones sobre señales no aptas para ese fin, que supera el estado del arte. En segundo lugar, se presenta un método para la cuantificación de la perturbación del periodo de la señal, basado en operadores de synchrosqueezing de cuarto orden, que resulta más robusto frente a grandes variaciones de la duración de los ciclos que los métodos tradicionales. Voice perturbations are smal cycle-to-cycle deviations of the voice signal parameters, and measuring their level is an important task for diagnostics of pathologies associated with the phonatory system. Perturbation measures used with this purpose require some degree of periodicity and they usually underestimate the true value of the perturbation when mayor fluctuations of the parameter under study, such as the cycle duration, ocurr. In this thesis, a method for automatic classification of signals based on support vector machines is introduced, the aim of which is to avoid the use of perturbation measures on signals that are not suitable for this kind of analysis. Following this, a novel method for voice jitter estimation, based on fourth-order synchrosqueezing operators, is introduced. This new method is more robust to large variations on the cycle duration of the signal than traditional methods. Consejo Nacional de Investigaciones Científicas y Técnicas
Published: 2021

3. Malicious URL detection using machine learning techniques

Author: Céspedes Maestre, María Martha, Salcedo Parra, Octavio José, and Salazar Herrera, Carlos Alberto
Subjects: 620 - Ingeniería y operaciones afines, Regresión logística, Random Forest, Localizador uniforme de recursos (URL), Extracción de características, Aprendizaje automático, Machine Learning, Máquinas de vectores de soporte, Uniform Resource Locator (URL), Support Vector Machines, Lenguaje de programación, Protección de datos, Feature extraction, Logistic Regression, 000 - Ciencias de la computación, información y obras generales, Computer languages, Bosque aleatorio, Data protection
Abstract: Documento con toda la información relevante de la investigación Ilustraciones, gráficos En la actualidad, los ciberdelincuentes perpetran ataques web de forma sencilla, en los que aplican diferentes vectores para poner en peligro la seguridad de la información y en los que entienden al ser humano como un flanco fácil para lograr sus objetivos. Generalmente, los usuarios de internet deben realizar una acción que permita el éxito del ataque, por ejemplo, dar clic a alguna URL. Es por lo anterior, que muchos esfuerzos están dirigidos a encontrar técnicas que mitiguen esta problemática y se apuestan grandes cantidades de dinero en generar soluciones. Tomando como referencia el uso de listas negras, la clasificación heurística, y, prestando especial atención a las técnicas de aprendizaje automático capaces de detectar ataques de día cero, en el presente trabajo se despliega un diseño de detección de URLs maliciosas, haciendo uso de criterios léxicos y de ofuscación de la URL. Estas, clasificadas por medio de técnicas de aprendizaje automático como Logistic Regression, Support Vector Machine y Random Forest; demostrando que los tres clasificadores implementados mantienen una relación de eficacia y rendimiento con porcentajes de precisión del 98%, y, tiempos de respuesta satisfactorio. Es preciso aclarar que Random Forest puede estar sujeto a mejoras, ya que se pretende detectar de manera automática las URLs maliciosas y este clasificador tarda en promedio 16 segundos en hacerlo. Como resultado general del diseño, se obtiene un modelo de libre distribución que puede ser utilizado de forma masiva por diferentes usuarios en la red, capaz de detectar de forma precisa URLs maliciosas. Today, cybercriminals carry out web attacks in a simple way, in which they apply different vectors to endanger information security and in which they understand the human being as an easy flank to achieve their objectives. Generally, Internet users must take an action that allows the attack to succeed, for example, clicking on a URL. This is why many efforts are aimed at finding techniques that mitigate this problem and large amount of money are bet on generating solutions. Taking as a reference the use of blacklists, heuristic classification, and, paying special attention to machine learning techniques capable of detecting zero-day attacks, in this work a design for detecting malicious URLs is deployed, making use of criteria Lexical and URL obfuscation. These, classified by means of machine learning techniques such as Logistic Regression, Support Vector Machine and Random Forest; demonstrating that the three implemented classifiers maintain an efficiency and performance ratio with 98% accuracy percentages, and satisfactory response times. It should be clarified that Random Forest may be subject to improvements, since it is intended to automatically detect malicious URLs and this classifier takes an average of 16 seconds to do so. As a general result of the design, a free distribution model is obtained that can be used an masse by different users on the network, capable of accurately detecting malicious URLs. Maestría Magíster en Telecomunicaciones La metodología que se usa para el diseño del modelo es una metodología cuantitativa, la cual es un enfoque de la ingeniería de software centrada en estrategias experimentales con cumplimiento de procedimientos basados en etapa. Tomando como referencia los atributos claves para detección sólida de phishing, se construye una metodología que permita dar cumplimiento a cada uno de los objetivos trazados, las etapas usadas son: Naturaleza y origen de los datos Extracción de características Métodos de clasificación Configuración o metodología experimental Seguridad Informática
Published: 2021

4. Elaboración de una metodología de trabajo para el tratamiento y la predicción de series temporales de consumo de agua potable

Author: Morer, Fidae el
Subjects: Series temporales, Random Forest, Time series, Agua potable, Neural Networks, ESTADISTICA E INVESTIGACION OPERATIVA, Máquinas de soporte vectorial, Gradient Boosting, Modelo predictivo, Machine Learning, Deep Learning, Support Vector Machines, Máster Universitario en Ingeniería de Análisis de Datos, Mejora de Procesos y Toma de Decisiones-Màster Universitari en Enginyeria D'Anàlisi de Dades, Millora de Processos i Presa de Decisions, Redes Neuronales, Drinking water, Forecasting
Abstract: [ES] El presente trabajo consiste en la elaboración de una metodología para el análisis de una serie temporal de caudal de agua potable en un sector hidráulico de tipo domiciliario de una ciudad de la provincia de Valencia (España). Esta metodología aborda la reconstrucción de la serie temporal mediante la imputación de valores faltantes, la corrección de valores anómalos y la predicción del consumo a corto plazo mediante el uso de técnicas de machine learning y deep learning. La investigación llevada a cabo propone una metodología novedosa, puesto que en la literatura científica relacionada con este ámbito no se ha abordado el problema del tratamiento de este tipo de series temporales de manera integral. La metodología desarrollada, por lo tanto, pretende ser la semilla de un sistema de ayuda para la toma de decisiones que permita decidir, para cada tipo de serie temporal de caudal de agua potable o similares, cuál es la estrategia idónea que debe seguir el analista para optimizar la predicción del consumo en un sector hidráulico, y por ende, la operación del propio sistema de distribución asociado., [EN] The following research consists in the elaboration of a methodology for the analysis of a time series of drinking water flow rate in a domestic hydraulic sector of a city in the province of Valencia (Spain). This methodology deals with the reconstruction of the time series through the imputation of missing values, the correction of outliers and the forecasting of short-term consumption using machine learning and deep learning techniques. The conducted research proposes a novel methodology since the treatment of this kind of time series has not been addressed in a comprehensive way in the scientific literature related to this field. The developed methodology, aims to be the seed of a decision support system that allows to decide, for each kind of time series of drinking water flow rate or similar, which is the ideal strategy to be followed by the analyst to optimize the forecast of the flow rate in a hydraulic sector, and therefore, the operation of the associated distribution system.
Published: 2021

5. Análisis de clasificadores para determinar el potencial de clientes nuevos en una empresa industrial

Author: Bonilla Cruz, Juan Sebastián, Puig de Dou, Ignacio, and Universitat Politècnica de Catalunya. Departament d'Estadística i Investigació Operativa
Subjects: Machine Learning, Regresión Logística, Ensambles, Statistical Mathematics -- Applications, Stacking, Matemàtiques i estadística::Estadística matemàtica [Àrees temàtiques de la UPC], Support Vector Machines, Estadística matemàtica--Aplicacions, Gradient Boosting Methods, Aprendizaje Estadístico, 62 Statistics::62P Applications [Classificació AMS], Modelos de Clasificación
Abstract: El objetivo de este trabajo de fin de Máster es analizar y combinar diferentes clasificadores de aprendizaje estadístico que permitan determinar el potencial de nuevos clientes en función de las características de su primera compra. Se utiliza información de una empresa del sector de distribución industrial mayorista con sede en Catalunya. La información utilizada se divide en 3 principales fuentes de información: información de la primera compra, información de los clientes proveída por la empresa e información de los clientes obtenida del Registro Mercantil Español. Se analizan tres clasificadores base y un ensamble de los mismos, creado mediante el método stacking. Los clasificadores base son: Regresión Logística , Gradient Boosting (GBM) y Support Vector Machines (SVM).
Published: 2021

6. Aprendizaje automático para identificación de razas caninas

Author: Rodríguez Loriente, Marcos
Subjects: Machine Learning, Neural Networks, Artificial Intelligence, Image classification, Support Vector Machines, Grado en Ingeniería Informática-Grau en Enginyeria Informàtica, Máquinas de vectores soporte, Redes neuronales, Inteligencia Artificial, Clasificación de imágenes, LENGUAJES Y SISTEMAS INFORMATICOS, Aprendizaje automático
Abstract: [ES] Dada la imagen de un perro, se pretenden utilizar técnicas de Aprendizaje Automático para determinar su raza entre un conjunto de 120 razas totales. Para ello se dispone de un dataset con un total de 10222 imágenes etiquetadas que actuarán como conjunto de entrenamiento para nuestro modelo y disponemos también de un conjunto de 10357 imágenes no etiquetadas que pretendemos clasificar. El objetivo del trabajo será implementar un clasificador con el mínimo error posible empleando para ello diferentes técnicas de Aprendizaje Automático, como Máquinas de Vector Soporte y Redes Neuronales. Para poder implementar dicho clasificador se recurrirá al uso de librerías Python como Keras y Tensorflow., [EN] Given the image of a dog, it is intended to use Machine Learning techniques to determine its breed among a set of 120 total breeds. For this, we have a dataset with a total of 10222 labeled images that will act as a training set for our model and we also have a set of 10357 unlabeled images that we intend to classify. The objective of the work is to implement a classifier with the minimum possible error, using different Machine Learning techniques such as Support Vector Machines and Neural Networks. In order to implement this classifier we will use some Python specialized libraries such as Keras and Tensorflow., [CA] A partir de la imatge d´un gos, tractarem d´ identificar la seva raça entre un conjunt total de 120 races possibles. Per a realizar aquesta labor es disposa d´un dataset amb un total de 10222 imatges etiquetades amb la raça corresponent que actuaran com a conjunt d´entrenament per al nostre model i a la vegada disposarem també d´un conjunt de 10357 imatges no etiquetades que tractarem de clasificar. L´objectiu del treball serà implementar un classificador amb un mínim error possible utilitzant per a aquest fi diferents mètodes d´Aprenentatge Automàtic com Màquines de Vectors Support i Xarxes Neuronals. Per a poder implementar aquest classificador s´utilitzaran llibreries especialitzades de Python com Keras i Tensorflow.
Published: 2021

7. Special Issue on Artificial Intelligence

Author: Dora María Ballesteros
Subjects: Computer science, business.industry, Science, General Engineering, Deep learning, Engineering (General). Civil engineering (General), Big data analytics, Clustering, Expert systems, Support Vector Machines, Artificial intelligence, TA1-2040, business
Abstract: Artificial intelligence (AI) is an interdisciplinary subject in science and engineering that makes it possible for machines to learn from data. Artificial Intelligence applications include prediction, recommendation, classification and recognition, object detection, natural language processing, autonomous systems, among others. The topics of the articles in this special issue include deep learning applied to medicine [1, 3], support vector machine applied to ecosystems [2], human-robot interaction [4], clustering in the identification of anomalous patterns in communication networks [5], expert systems for the simulation of natural disaster scenarios [6], real-time algorithms of artificial intelligence [7] and big data analytics for natural disasters [8]. Artificial intelligence (AI) is an interdisciplinary subject in science and engineering that makes it possible for machines to learn from data. Artificial Intelligence applications include prediction, recommendation, classification and recognition, object detection, natural language processing, autonomous systems, among others. The topics of the articles in this special issue include deep learning applied to medicine [1, 3], support vector machine applied to ecosystems [2], human-robot interaction [4], clustering in the identification of anomalous patterns in communication networks [5], expert systems for the simulation of natural disaster scenarios [6], real-time algorithms of artificial intelligence [7] and big data analytics for natural disasters [8].
Published: 2020

8. Machine learning methods in prospective studies after an example of financing innovation in Colombia

Author: Javier Humberto Ospina-Holguín, Javier Enrique Medina-Vásquez, and Ana Milena Padilla-Ospina
Subjects: random forests, Technological innovations. Automation, redes neuronales, máquinas de gradiente potenciado, bosques aleatorios, logistic regression, HD45-45.2, Social Sciences, General Medicine, máquinas de vectores de soporte, HD28-70, support vector machines, máquinas de gradiente potencia, Industries. Land use. Labor, regresión logística, Management. Industrial management, gradient powered machines, neuronal networks, HD28-9999
Abstract: Resumen El propósito de este artículo es hacer una breve introducción a cinco métodos avanzados de predicción de aprendizaje automático, que pueden ser de utilidad para el desarrollo de estudios prospectivos: la regresión logística, las máquinas de vectores de soporte, las máquinas de gradiente potenciado, los bosques aleatorios y las redes neuronales. Además, se explica qué metodología se puede llevar a cabo para asegurar la robustez y validar dichos modelos de predicción. A manera de ejemplo, se presenta cómo el uso de estos métodos permitió identificar las variables financieras más importantes para predecir el desarrollo de actividades de innovación en pymes colombianas. Los resultados del uso de estos métodos pueden permitir la generación de pronósticos al corto y mediano plazo, que sirvan para la realización de estudios prospectivos con métodos más amplios, como la construcción de escenarios, con el propósito de generar propuestas basadas en la evidencia, como hoja de ruta para la planeación y política pública al largo plazo. Abstract The purpose of this article is to make a brief introduction to five advanced machine learning prediction methods which may be useful for the development of prospective studies: logistic regression, support vector machines, gradient powered machines, random forests and neural networks. In addition, it is explained what methodology can be carried out to ensure robustness and validate these prediction models. As an example, it is presented how the use of these methods allowed to identify the most important financial variables to predict the development of innovation activities in Colombian SMEs. The results of the use of these methods may allow generating short and medium-term forecasts that serve to facilitate prospective studies with broader methods, such as the construction of scenarios, with the purpose of generating evidence-based proposals as a roadmap for long-term planning and public policy.
Published: 2020

9. Aplicación de Radiomics basado en TC para la detección del oncogén KRAS en pacientes con cáncer colorrectal

Author: Porto Álvarez, Jacobo, Souto Bayarri, Miguel, Huelga Zapico, Emilio, Cernadas García, Eva, and Universidade de Santiago de Compostela. Facultade de Medicina e Odontoloxía
Subjects: Oncoxén KRAS, Support Vector Machines, Cancro colorrectal, Cáncer colorrectal, Oncogén KRAS, Máquinas de Vectores de Soporte
Abstract: Traballo de Fin de Grao en Medicina. Curso 2019-2020. En este trabajo de final de grado se intentó identificar la mutación en el oncogén KRAS partiendo del sistema clásico de visión artificial. Mediante técnicas descriptivas, se extrajeron las características de la textura de la imagen de TC de pacientes con cáncer colorrectal, y se clasificaron mediante Máquinas de Vectores de Soporte (SVM) en KRAS+ o KRAS-. El análisis de textura puede proporcionar una evaluación cuantitativa de la heterogeneidad tumoral mediante el análisis de la distribución y relación entre los pixeles de la imagen. El objetivo de este trabajo es demostrar que Radiomics basado en TC puede predecir la presencia de mutación en el oncogén KRAS en cáncer colorrectal. Se trata de un estudio transversal, con 47 pacientes del Hospital Clínico de Santiago de Compostela y del Hospital Provincial de Conxo de los que también está disponible el análisis anatomopatológico confirmatorio de dicha mutación. El hecho de poder identificar la expresión genética de un tumor sin tener que hacer una biopsia y un test genético supone una ventaja para el paciente y para el médico, ya que puede permitir tanto evitar procedimientos invasivos que supongan complicaciones y presenten sesgos en la muestra, como orientar hacia una técnica o tratamiento más personalizado y eficaz. Neste proxecto de fin de grao, intentouse identificar a mutación no oncoxen KRAS baseado no sistema clásico de visión artificial. Usando técnicas descritivas, extraéronse as características da textura da imaxe de TC de doentes con cancro colorrectal e clasificáronse mediante Máquinas de Vector de Soporte (SVM) en KRAS + ou KRAS-. A análise de textura pode proporcionar unha avaliación cuantitativa da heteroxeneidade do tumor mediante a análise da distribución e relación entre pixeles da imaxe. O obxectivo deste traballo é demostrar que a Radiómica baseada en TC pode predicir a presenza de mutación no oncoxen KRAS no cancro colorrectal. Trátase dun estudo transversal, con 47 doentes do Hospital Clínico de Santiago de Compostela e do Hospital Provincial de Conxo, dos que tamén se dispón dunha análise anatomopatolóxica confirmativa da devandita mutación. O feito de poder identificar a expresión xenética dun tumor sen ter que facer unha biopsia e unha proba xenética é unha vantaxe para o doente e para o médico, xa que tanto pode evitar procedementos invasivos que impliquen complicacións e presenten sesgos na mostra, como orientar cara a unha técnica ou tratamento máis personalizado e eficaz. In this final degree project, we tried to identify the oncogene KRAS mutation starting from the classic computer vision system. Using descriptive techniques, the characteristics of the CT image texture of patients with colorectal cancer were extracted and classified using Support Vector Machines (SVM) in KRAS+ or KRAS-. Texture analysis can provide a quantitative assessment of tumor heterogeneity by analyzing the distribution and relationship between the pixels in the image. The objective of this research is to demonstrate that CT-based Radiomics can predict the presence of mutation in the KRAS gene in colorectal cancer. This is a retrospective study, with 47 patients from the Clinical Hospital of Santiago de Compostela and the Provincial Hospital of Conxo, from whom we also had available the confirmatory pathological analysis of KRAS mutation. The fact of being able to identify the genetic expression of a tumor without having to do a biopsy and a genetic test is an advantage, both for the patient and the doctor. It prevents invasive procedures that involve complications and presenting biases in the sample. As well, it leads towards a more personalized and effective treatment.
Published: 2020

10. Estudio comparativo entre máquinas de soporte vectorial multiclase, redes neuronales artificiales y sistema de inferencia neuro-difuso auto organizado para problemas de clasificación

Author: Galindo, Eiber A., Perdomo, Jairo A., and Figueroa-García, Juan C.
Subjects: redes neuronales, neural networks, lógica difusa, máquinas de soporte vectorial, algoritmos inteligentes, intelligent algorithms, fuzzy logic, support vector machines
Abstract: Resumen: En este trabajo se contextualiza un sistema neuro-difuso autoorganizado (SONFIS), su estructura y funcionamiento son explicados en detalle. Se usa el algoritmo SONFIS en tres problemas de clasificación (Fisher iris, Cáncer de Seno y Actividades Humanas) para posteriormente comparar sus resultados frente a clasificadores universales de buen desempeño en problemas de clasificación como las redes neuronales artificiales (ANN) y máquinas de soporte vectorial multiclase (SVM). Se hace una breve descripción de cada uno de estos métodos. Los resultados del estudio muestran que SONFIS tiene un desempeño similar y en algunos casos mejor que ANN y SVM en problemas de clasificación, con la ventaja que genera una base de reglas que puede usarse para entender el problema estructuralmente. Abstract: In this paper an explanation of the structure and how a self-organized neuro-fuzzy inference system (SONFIS) works, is given with detail. The study uses three classification problems (Fisher iris, Breast Cancer and Human Activities) to then compare the results with well-known universal classifiers such as artificial neural networks (ANN) and multiclass support vector machines (SVM). A brief description of each of these methods is presented. The results show that SONFIS has a similar, and sometimes better, performance than ANN and SVM with the advantage of generating a rule basis that helps understanding the inner structure of the problem.
Published: 2020

11. Comparativo de kernels sobre predicción de oferta de fuentes alternativas de energía

Author: Mora-Paz, Héctor Andrés
Subjects: photovoltaic energy, Máster Universitario en Inteligencia Artificial, maquinas de vectores de soporte, kernel function, energía fotovoltaica, función kernel, artificial neural networks, imágenes satelitales, support vector machines, satellite images, redes neuronales artificiales
Abstract: The need to mitigate the climate change crisis and meet the energy demand has turned attention to clean energy sources, such as photovoltaics. Promoting studies focused on supply as in (Cabrera, 2016), where large databases of NASA from Landsat and MODIS satellite images were structured for a given geographical area, producing good patterns in both Artificial Neural Networks (ANN) and Support Vector Machines (SVM). However, the performance of these algorithms has not yet been evaluated using kernel functions such as those proposed by Belanche (2015). To solve this in this research, it is contributed with the efficient acquisition of training data from Big data, specialization of the ANN and SVM algorithms with kernels coupled to scikit-learn, experimental framework for hyperparameter tuning and discussion, where it is shown that the functions kernel manage to improve the results of the state of the art. La necesidad de mitigar la crisis del cambio climático y suplir la demanda energética, ha girado la atención hacia las fuentes de energías limpias, como la fotovoltaica. Promoviendo estudios enfocados en la oferta como en (Cabrera, 2016), donde se estructuraron para una superficie geográfica determinada, grandes bases de datos desde imágenes satelitales Landsat y MODIS de NASA, produciendo buenos patrones tanto en Redes Neuronales Artificiales (ANN) como en Máquinas de Soporte Vectorial (SVM). No obstante aún no se ha evaluado el desempeño de estos algoritmos haciendo uso de funciones kernel como las propuestas por Belanche (2015). Para solventar esto en esta investigación se aporta con la adquisición eficiente de datos de entrenamiento desde Big data, especialización de los algoritmos ANN y SVM con kernels acoplados a scikit-learn, marco experimental para sintonización de hiperparámetros y discusión, donde se muestra que las funciones kernel consiguen mejorar los resultados del estado del arte.
Published: 2019

12. Application of Time-Frequency Transformations in Polarimetric Ultra-Wideband MIMO-GPR signals for Detection of Colombian Improvised Explosive Devices

Author: Gutiérrez Duarte, Sergio Alonso and Vega Stavro, José Félix
Subjects: Classification of improvised explosive devices, Ultra-wideband MIMO radar, Polarimetric measurements, Support vector machines, Polarimetric radar, Machine learning, Landmine detection, Feature extraction, Ground penetrating radar
Abstract: In this thesis, a new radar technique for GPR detection and discrimination of Improvised Explosive Devices is presented and validated. Data processing, consisting of adaptive filters and time-frequency transformations, are applied to polarimetric GPR data, in order to construct feature vectors of the targets. These vectors are used as inputs of a support vector machine algorithm, in order to discriminate buried targets either as improvised explosive device (IED) or clutter. The main contributions of this thesis are as follows. First, the permittivity of improvised ANFO explosives is measured. This information is used for manufacturing inert surrogates of IEDs. Second, we proposed the construction of target feature vectors (TFVs) from polarimetric GPR measurements. Third, recursive algorithms and background removal are combined to improve the clutter removal. Data processing methods are assembled, combining clutter removal stage, time-frequency transformation and singular value decomposition. In total, eight data processing methods are proposed. Moreover, for every method, 13 TFVs are assembled. Then, the TFVs are used to train and test support vector machines (SVM) under a binary classification approach. Classification results are validated by using the leave-two-out cross-validation. Accuracy of 87.02% in the best classifier was obtained. The main conclusion of this thesis is that combining polarimetric GPR measurements, feature extraction using time-frequency transformations, and SVM classifications allows obtaining discriminating features that improve the IED detection rates compared with metal detector performance. Furthermore, the proposed approach can be implemented in a hand-held detection device and to be used in a humanitarian demining scenario. Keywords: Classification of improvised explosive devices, feature extraction, ground penetrating radar, permittivity of explosives, polarimetric measurements, support vector machines, ultra-wideband MIMO radar. Resumen En esta tesis, se presenta y valida una nueva técnica de radar para realizar mediciones GPR. Se proponen estructuras de procesamiento de datos GPR que utilizan filtros adaptativos y transformaciones tiempo-frecuencia como parte de la construcción de vectores de características de los objetos. Estos vectores son utilizados como entradas de un algoritmo de máquinas de soporte vectorial para discriminar los objetos enterrados como un artefacto explosivo improvisado (IED) o como un objeto aleatorio (Non-IED). Los principales aportes de esta tesis son los siguientes. Primero, se mide y se reporta la permitividad de explosivos improvisados de tipo ANFO, información que posteriormente es usada para la fabricación de objetos inertes sustitutos de los IEDs. Segundo, se propone utilizar medidas polarimétricas GPR de objetos enterrados para la construcción de vectores de características (TFVs). Tercero, dentro de las técnicas de procesamiento de las medidas polarimétricas, se propone combinar los algoritmos recursivos y la supresión de señales de fondo para mejorar la eliminación de las señales no deseadas (clutter). Además, se ensamblan ocho métodos diferentes de procesamiento de señales, los cuales combinan la fase de eliminación del clutter, transformadas de tiempo-frecuencia y la descomposición de valores singulares. Adicionalmente, para cada método, se ensamblaron 13 TFVs. Posteriormente, se utilizan estos TFVs para entrenar y probar máquinas de soporte vectorial que funcionan bajo una estructura de clasificación binaria. Los resultados de clasificación son corroborados utilizando la validación cruzada leave-two-out (“dejar dos fuera”). El mejor clasificador que se obtuvo tiene una exactitud de 87.02%. La principal conclusión de esta tesis es que al combinar las medidas GPR polarimétricas, la extracción de características mediante transformaciones tiempo-frecuencia y las máquinas de soporte vectorial, se pueden obtener características discriminatorias que mejoran las tasas de detección de IEDs, en comparación con un detector de metales. Adicionalmente, el enfoque propuesto puede ser implementado en un dispositivo de detección portátil y usarse en un escenario de desminado humanitario. Palabras clave: Clasificación de artefactos explosivos improvisados, extracción de características, radar de penetración terrestre, permitividad de explosivos, máquinas de soporte vectorial, medidas polarimétricas, radar MIMO de banda ultra ancha. Doctorado
Published: 2019

13. A Novel Hybrid SVM-CNN Method for Extracting Characteristics and Classifying Cattle Branding

Author: Carlos Silva and Daniel Welfer
Subjects: Electronic computers. Computer science, Support Vector Machines, Cattle Branding, Convolutional Neural Network, QA75.5-76.95
Abstract: A tool that can perform the automatic identification of cattle brandings is essential for the government agencies responsible for the record, control and inspection of this activity. This article presents a novel hybrid method that uses Convolutional Neural Networks (CNN) to extract features from images and Support Vector Machines (SVM) to classify the brandings. The experiments were performed using a cattle branding image set provided by the City Hall of Bagé, Brazil. Metrics of Overall Accuracy, Recall, Precision, Kappa Coefficient, and Processing Time were used in order to assess the proposed tool. The results obtained here were satisfactory, reaching a Overall Accuracy of 93.11% in the first experiment with 39 brandings and 1,950 sample images, and 95.34% of accuracy in the second experiment, with the same 39 brandings, but with 2,730 sample images. The processing time attained in the experiments was 31.661s and 41.749s, respectively.
Published: 2019
Full Text: View/download PDF

14. On the Use of Positive Sequence Current / Negative Sequence Current Ratio for Fault Detection in Induction Motors

Author: Oviedo Castillo, Silvia Juliana and Quiroga Méndez, Jabid
Subjects: Corriente de Secuencia Positiva, Classificação das falhas, Support vector machines, Positive Sequence Current, Negative Sequence Current, Clasificación de fallas, Corriente de Secuencia Negativa, Corrente de sequência positiva, Máquinas de soporte vectorial, MCSA, corrente de sequência negativa, máquinas de vetores de suporte, Fault classification
Abstract: Resumen En este trabajo se estudió el uso de un nuevo rasgo para la detección de fallas en el devanado y la jaula de un motor de inducción, y presenta la validación experimental de un esquema de detección e identificación utilizando Máquinas de Vectores Soporte (SVM). Esta validación se realizó en un banco de pruebas usando motores de 2 HP, 4 polos en los que fueron inducidas las fallas de corto circuito en el estator y barras rotas, por separado. Los rasgos en dominio tiempo y dominio de la frecuencia como la media aritmética, valor RMS, frecuencia central, curtosis, valor RMS de la densidad espectral de potencia fueron evaluados y validados a partir de datos experimentales para varias condiciones de carga. El rasgo relación PSC/NSC (corriente de secuencia positiva / corriente de secuencia negativa) tuvo un desempeño satisfactorio en la mayoría de los clasificadores independiente del régimen de carga. Este nuevo rasgo se evaluó en términos de detección de fallos y la discriminación entre los diferentes grados de severidad con resultados satisfactorios. Abstract This paper studied the use of a new stator current feature for detection of winding and cage bars faults in an induction motor, and presents the experimental validation of a detection and identification scheme using Support Vector Machines (SVM). This validation was performed in a test bed using 2 HP, 4 pole motors in which shorted winding and broken bars faults were induced, separately. Both time and frequency domain features like arithmetic mean, RMS value, Central Frequency, Kurtosis, RMS value of Power Spectral Density were assessed and validated using experimental data for several load conditions. PSC/NSC (positive sequence current/ negative sequence current) ratio was successful in ' most of the classifiers despite the load regime. This new feature was evaluated in terms of fault detection and severity discrimination with satisfactory results. Resumo Neste trabalho foi estudado o uso de um novo recurso para a detecção de falhas nos rolamentos e na gaiola de esquilo de um motor de indução, e apresenta a validação experimental de um esquema de detecção e identificação utilizando máquinas de vetores de suporte (SVM). Esta validação foi realizada num banco de ensaios utilizando motores de 2 HP, 4 polos nos quais foram induzidas as falhas de curto circuito no estator e barras quebradas, separadamente. Os recursos em domínio do tempo e no domínio da frequência como a média aritmética, valor RMS, frequência central, curtose, valor RMS da densidade espectral de potência foram avaliados e validados a partir de dados experimentais para várias condições de carga. O recurso relação PSC/NSC (corrente de sequência positiva/corrente de sequência negativa) teve um desempenho satisfatório na maioria dos classificadores independente do régime de carga. Este novo recurso foi avaliada em termos de detecção de falhas e discriminação entre os diferentes graus de severidade com resultados satisfatórios.
Published: 2019

15. Detección de transiciones posturales para aplicaciones médicas, usando datos obtenidos de sensores inerciales de un Smartphone

Author: Celedón Rocha, Jorge Eliécer, Universitat Politècnica de Catalunya. Departament d'Enginyeria de Sistemes, Automàtica i Informàtica Industrial, and Català Mallofré, Andreu
Subjects: Support vector machines, Support vector machine, Informàtica::Automàtica i control [Àrees temàtiques de la UPC], Síndrome de fragilidad, Enginyeria biomèdica [Àrees temàtiques de la UPC], Transición postural, Acelerómetro, Máquinas de soporte vectorial, Frailty syndrome, Aprendizaje automático, Especificidad, Accelerometer, Automatic learning, Sensitivity, LOOCV, Specificity, Smartphone, Sensibilidad, Aprenentatge automatic, Postural transition
Abstract: [CASTELLÀ] El síndrome de fragilidad consiste en la pérdida de homeóstasis del cuerpo, y se asocia con la pérdida de movilidad y fuerza de las personas. Se considera que tener este síndrome podría acelerar la muerte. Una manera de medir la movilidad, y poder detectar el síndrome, es con la ayuda de sensores inerciales En un comienzo las mediciones de movilidad se realizaban con múltiples sensores distribuidos en diferentes partes del cuerpo. Luego se reduce a uno solo para que se sea práctico en la vida diaria, aunque con la condición de que el sensor deba estar ubicado en una posición específica. En este trabajo se propone independizar la orientación y localización del sensor para analizar la movilidad, y que pueda ser extendidos a Smartphone que cuenten con acelerómetros. Específicamente, se realiza un detector de transiciones posturales, sentarse o levantarse utilizando la técnica de aprendizaje automático Support Vector Machine. Se trabaja con dos bases de datos para obtener dos modelos diferentes, la primera obtiene datos con un móvil Samsung Galaxy II ubicado en la cintura, y la segunda se realiza con un acelerómetro ubicado en el bolsillo del pantalón, sin que se sepa la orientación del mismo. Ambos modelos son puestos a prueba con señales obtenidas de un móvil Huawei ubicado en el bolsillo del pantalón. Después de obtener un modelo para cada base de datos, se combinan para obtener un modelo adicional, y realizar la selección del mejor. Finalmente se escoge el modelo obtenido con la base de datos uno, el cual dio un resultado de sensibilidad 61%, y especificidad de 99%. [ANGLÈS] Frailty syndrome is associated with mobility and strength loss. People with the disease could die sooner than expected. Detecting when the syndrome starts could improve the patient’s life quality. A way to detect the beginning could be by measuring body mobility and detect changes in the human life-time. Decades ago, human activities were studied using multiple sensors around the body, making the procedure uncomfortable for the daily living. For that reason, a single sensor gained terrain in the study of the human movement. The main problem was the sensor must be placed in a specific place and orientation to work well with the algorithm. In this dissertation, the purpose is to get orientation and location independence while using an accelerometer on the body to study the human movement. To be more specific, a model to identify postural transitions is made using support vector machine, and the procedure is compatible with the signals acquired from a Smartphone’s accelerometers. Two data sets are used to obtain two different models. The first one has data of signals acquired with a Samsung Galaxy II on the waist. The second one is taken with accelerometers in the pockets. Both models are tested with signals from a Huawei phone. The model chosen has 99% specificity and 61% sensibility while using data set one to train the model.
Published: 2019

16. Sistema multimodal para la evaluación del riesgo de cáncer de mama desde el enfoque de la minería de datos

Author: Moreno Claver, Jordi
Subjects: Support vector machines, Breast cancer, Cáncer de mama, SVM, Grado en Ingeniería de Sistemas de Telecomunicación, Sonido e Imagen-Grau en Enginyeria de Sistemes de Telecomunicació, So i Imatge, Redes neuronales, Minería de datos, Naïve Bayes, Data mining, Neural networks, FILOLOGIA INGLESA
Abstract: [ES] A través de la minería de datos, podemos desarrollar sistemas de recomendación que guíen las decisiones de los usuarios. El objetivo del trabajo es el diseño y desarrollo de una aplicación informática que, a partir de la información sobre un determinado paciente, pueda predecir si el tumor de mama en cuestión es benigno o maligno. Más concretamente, la información más relevante que se extraerá del input a clasificar provendrá de descriptores numéricos sobre el tumor, p.ej. radio, textura, área, etc. Este tipo de asistente médico realizará la predicción basándose en métodos supervisados de minería de datos. La entrada de datos del sistema será vía voz o texto escrito en español, tras lo cual se aplicará un preprocesamiento del input con el fin de que el sistema pueda trabajar con datos estructurados. En una siguiente fase, se emplearán métodos como Naïve Bayes, Support Vector Machines (SVM) y aprendizaje profundo con redes neuronales sobre datos de entrenamiento con el fin de que se detecten patrones que permitan la clasificación del input. Este sistema de predicción también será capaz de determinar qué método es más efectivo tras un proceso de autoevaluación. Este sistema se programará en C# dentro del entorno de Microsoft Visual Studio., [EN] Recommendation systems can be developed to guide users¿ decisions through data mining. The aim of this work is to design and develop a computer application that uses the information about a given patient to predict if a specific breast tumor is benign or not. In particular, the most relevant information extracted from the input is provided by numeric descriptors about the tumor, e.g. radius, texture, area, etc. This type of medical assistant is intended to make predictions based on supervised data mining methods. The input of the system, which is via voice or text in Spanish, should be preprocessed to be converted into structured data. In the next step, we apply methods such as Naïve Bayes, Support Vector Machines (SVM) and deep learning with neural networks to training data, so that patterns are discovered to classify the input. This prediction system will also be able to determine the most effective method by means of self-assessment. The application will be developed with C# within the Microsoft Visual Studio environment.
Published: 2019

17. Modelos de mezclas de regresiones lineales para computación distribuida

Author: Pereira Delgado, Jorge, Gómez Verdejo, Vanessa, and Universidad Carlos III de Madrid. Departamento de Teoría de la Señal y Comunicaciones
Subjects: Big data, Telecomunicaciones, Algoritmos, Support Vector Machines, Aprendizaje distribuido
Abstract: Big Data is a concept related to extremely large databases so that they cannot be processed with standard algorithms. For this reason, the concept of cluster computering was created. Here, the data is partitioned and processed in a computer cluster, so each one of the computers can process a part of the data and obtain a partial solution to our problem that, combined with the other partials solutions obtained from the other computer, we manage to obtain the solution. This way, we sharply reduce the computational cost of the original problem by breaking it into little subproblems. This concept is quite new, so it is still developing. And here is where our bachelor` s thesis makes the difference. The goal of this project is to develop an algorithm able to fit non linear regression problems, which is an underdeveloped field in the distributed machine learning branch. The only algorithms that can solve this kind of problems and are completely integrated in Spark's machine learning library [2] are the Random Forests and the Neural Networks; not even the Support Vector Machines are able to do it because there are no Kernel implementations integrated yet. Our model aims to solve this problem based on a Linear Regression Mixture Model. The idea behind this is that, if we combine several Linear Regressions, we are able to break a non linear problem into several clusters that can be solved by linear algorithms. This way we manage to solve non linear problems and, furthermore, to do it in a more simple and interpretable way than other algorithms such as Random Forests or Neural Networks. The first part of this bachelor`s thesis will be to describe the different technologies and algorithms needed to fully understand the work developed here. Firstly, we explain all that we need to know about computer clusters and distributed computing. With a computer cluster we manage to have an excellent computing capacity without the need of a supercomputer. The problem here is that every computer in the cluster will only have a small part of the total data, thus not every algorithm is capable of being parallelized. For an algorithm to be parallelizable, we have to check if we need all the data to obtain the result or if we can apply it to partitions of it. If we can apply it to small parts of the dataset, then our algorithm will be parallelizable. That will be an important point in our work, because some algorithms will not be able to be parallelized and we will have to use alternative, parallelizable algorithms. In this part we also give a brief introduction to Apache Spark in its Python implementation, PySpark. We explain the most importants aspects of it. One important aspect of Spark is to understand the different kind of nodes in the computer clusters: Driver: Driver: manage the resources of the cluster and schedules all the tasks to be performed. Workers: performs the different transformations and actions over the partitions of the dataset. We also explain the RDDs or Resilient Distributed Databases, which are the basic parallelizable element in Apache Spark, and the two most important methods for the development of our algorithm in Apache Spark: map(): takes every data in the RDD and performs any function - passed as a parameter - we want individually. Usually, we will use a lambda function as the parameter. It returns a new RDD with the transformed data. reduce(): takes the data in the RDD and performs a binary, commutative and associative operation - passed as a parameter - to pairs of values and keeps the cumulative value in one of them, until it runs out of data and returns a single data, which will be returned to out driver. After that, we introduce the gradient descent optimization based algorithms. The simplest one is the Gradient Descent. This is an iterative method that, for each step, gives a better solution of the problem until it converges to a local minimum. In each step, it computes the gradient of the loss function. The idea here is that the gradient gives us the direction in which the slope is steepest, so, if we move in the opposite direction of the gradient, we will end up in a local minimum. Here, the magnitude that we move, or step size, will be critical, because if the step size is too large the algorithm will diverge, and if it is too small it will take too long until it converges. Once we have explained the basic gradient descent optimization algorithm, we are going to explain different evolutions that will fit better our problem and, in general, the distributed computing paradigm. Those algorithms are the Stochastic Gradient Descent and the Mini-Batch Gradient Descent. They take a small sample of the dataset - even only one in the case of the Stochastic Gradient Descent - and calculate a subgradient that will have the same expected value as the gradient. The subgradient will not be as precise as the gradient, but the computing time is much lower, which is critical when you are dealing with such big databases. Also, the Mini-Batch Gradient Descent, the one we will use here, usually converges very close to the point in which the standard Gradient Descent would have converged. In the next part, we explain the different Machine Learning algorithms that will have relevance in the development of this bachelor`s thesis. The first one are the Linear Regressions, which are based on, given a dataset, find a linear combination of a given set of functions, being the simplest case a line. To do it, we compute the minimum of the loss function, usually the Mean Squared Error or MSE. Big Data es un concepto que hace referencia a bases de datos tan grandes que las aplicaciones informáticas tradicionales de análisis de datos son incapaces de procesarlos. Por ello, surge el concepto de aprendizaje distribuido. En él, los datos se distribuyen en diferentes sistemas de almacenamiento y procesadores dentro de un clúster; de este modo, cada procesador trabaja en paralelo sobre un subconjunto de datos y, combinando las salidas parciales de cada procesador, se consigue así reducir la complejidad, coste y tiempo de computación en el tratamiento de los mismos [1]. Sin embargo, la implementación distribuida limita considerablemente el tipo de algoritmos de aprendizaje que pueden emplearse, ya que su formulación debe poder integrarse en el paradigma MapReduce. Así, por ejemplo, si nos fijamos en los algoritmos de clasificación y regresión disponibles en la librería MLlib [2], todos ellos utilizan implementaciones lineales basadas en el método de descenso por gradiente (Gradient Descent, GD). El objetivo de este proyecto es conseguir una implementación distribuida de algoritmos de regresión no lineales. Para ello, utilizaremos modelos de mezclas de regresiones lineales (Linear Regression Mixture Models, LRMM) [3]. De este modo, resolveremos un problema no-lineal como una mezcla de problemas lineales, a la vez que ganamos en interpretabilidad en los resultados y lo hacemos con un algoritmo completamente integrado en el modelo MapReduce, en el cual se basa el desarrollo de Apache Spark. En la Figura 1 se muestra un ejemplo de un problema con unos datos de entrada x y sus respectivos valores observados t. Vemos que estos no siguen una relación lineal, con lo que sería impensable ajustar dichos datos utilizando una regresión lineal para ajustar los datos de salida a los de entrada, ya que obtendríamos resultados inaceptables en cualquier aplicación. Sin embargo, si tomamos pequeñas porciones del conjunto de datos, vemos que dichos subconjuntos se pueden aproximar de forma bastante precisa con varias componentes, donde cada una de ellas es una regresión lineal diferente. Así, mezclando tres regresiones lineales, hemos resuelto de manera bastante satisfactoria un problema de regresión que no podía ser resuelto mediante una regresión lineal simple ... Ingeniería de Sistemas Audiovisuales
Published: 2018

18. Introduction to Quantum Machine Learning

Author: Torres Torres, Camilo Andrés and Benavides Navarro, Luis Daniel (dir)
Subjects: Aprendizaje de Máquina, Machine Learning, Algoritmos, Maquina de Vectores de Soporte, Support Vector Machines, Computación Cuántica, Quantum Computing
Abstract: En este documento se explorará cómo algunos algoritmos de aprendizaje de máquina pueden ser mejorados, cuadrática y exponencialmente, gracias a la computación cuántica. Se hace una breve introducción al mundo de los datos y por qué es importante realizar un procesamiento adecuado de los mismos, y dando las bases tanto del aprendizaje de máquina como de la computación cuántica, se describirá y se mostrará la implementación en un simulador cuántico, de un algoritmo de maquina de vectores de soporte (SVM), capaz de reconocer y clasificar imágenes de los dígitos 6 y 9, desarrollado e implementado físicamente por Zhaokai Li, Xiaomei Liu, Nanyang Xu, Jiangfeng Du, en la Universidad de Ciencia y Tecnología de China, Hefei, demostrando cómo se puede tener una mejora exponencial en complejidad temporal con respecto a su contraparte clásica., In this paper we will explore how some machine learning algorithms can be improved, quadratically and exponentially, thanks to quantum computing. There is a brief introduction to the world of data and why it is important to perform an adequate processing of them, and laying the foundations for both machine learning and quantum computing, the implementation of a support vector machine algorithm (SVM) in a quantum simulator will be described and shown, capable of recognizing and classifying images of digits 6 and 9, developed and implemented physically by Zhaokai Li, Xiaomei Liu, Nanyang Xu, Jiangfeng Du, at the University of Science and Technology from China, Hefei, demonstrating how one can have an exponential improvement in temporal complexity with respect to its classical counterpart., Pregrado, Ingeniero(a) de Sistemas
Published: 2018

19. Analysis and classification of technical analysis indicators by support vector machines

Author: Oliver-Muncharaz, Javier
Subjects: Índice bursátil Dow Jones Industrial, Tendencia, Support Vector Machines, ECONOMIA FINANCIERA Y CONTABILIDAD, Indicadores técnicos
Abstract: [EN] The search for models which can accurately forecast the market trend has developed over the past decades. Technical indicators and oscillators are the most usually employed inputs in the prediction models. These inputs basically rely on prices and the evolution of the index itself, which may cause some problems like multicolinearity and autocorrelation, in the case of linear models, or overoptimization and noise, in the case of neural networks. This paper proposes filtering the inputs to be employed in the models. To this end, their impact on the forecast will be analysed. A support vector machine will be used to this end, in order to characterize both inputs (indicators and oscillators) and output (market trend). Doing this, it can be assessed whether the relationship between the different inputs and the market trend offers relevant information regarding the contribution of the inputs in the prediction process and whether this contribution remains constant over time. Those inputs will be selected, which obtain more stable forecasts in order to obtain more consistent predictions., [ES] La búsqueda de modelos para la predicción de la tendencia de los índices bursátiles se ha desarrollado en las últimas décadas. Los indicadores y osciladores técnicos son los inputs más utilizados en todos los modelos. Éstos se basan fundamentalmente en los precios y dirección del propio índice. Esto puede provocar ciertos problemas en las estimaciones y procesos de aprendizajes de los diferentes modelos, como multicolinealidad y autocorrelación para el caso de modelos lineales y problemas de sobreoptimización y ruido en otros casos como en las redes neuronales. Se plantea filtrar los diferentes indicadores y osciladores técnicos a utilizar en los diferentes modelos. Para ellos, se va a analizar el impacto que tienen éstos en el proceso de predicción de la tendencia de un índice bursátil. El modelo utilizado es la support vector machine que permite encontrar las características tanto de los inputs (indicadores y osciladores) como del output (la tendencia del índice). Este mapeo de la relación de los indicadores y la tendencia ofrece información relevante sobre si dicha contribución a su predicción es estable en el tiempo. Por tanto, se seleccionarán aquellos inputs cuyas características estabilicen las predicciones en los modelos. Así pues, se deben descartar aquellos indicadores irregulares, aunque puntualmente puedan alcanzar ratios de acierto algo más elevadas que los más estables. Este proceso provocará obtener predicciones de la tendencia más consistentes.
Published: 2018

20. Clasificación Automática del Avance de Megaproyectos de Inversión Póblica en Colombia, desde un Enfoque Tócnico, Organizacional y Ambiental

Author: Gutiérrez Vanegas, Hugo Ernesto and Melgarejo Rey*, Miguel Alberto
Subjects: Support vector machines, español [Idioma], Complejidad, Redes, Spanish [Language], Megaprojects, Complexity, Maquinas de vectores de soporte, Megaproyectos, Gestión, Neural networks, Management
Abstract: Resumen Contexto: Se considera el marco técnico, organizacional y ambiental (TOE, por sus siglas en ingles) para el análisis de proyectos de gran escala como contexto para el desarrollo de clasificadores de avance de megaproyectos, según las necesidades del Departamento Nacional de Planeación, Colombia. Método: Se establecen algunas características para la clasificación del avance de proyectos de inversión pública, tomadas del marco TOE; a partir de estas, se construye una base de datos que se utiliza para entrenar dos clasificadores del avance de los proyectos reportados en la plataforma de seguimiento de proyectos de inversión del departamento de planeación nacional. Se empleo la información de cerca de 3200 proyectos registrados entre el 2008 y 2012, correspondientes a cuatro sectores económicos (medio ambiente y desarrollo sostenible, minas y energía, salud y protección social y transporte). La base de datos fue depurada siguiendo un enfoque analítico y cuantitativo. Se empleo el 70 % de los datos para entrenamiento y el 30 % para validación. Resultados: Se obtienen algunos modelos con tasas de clasificación superiores al 70 %, lo que valida la elección de características a partir del análisis del marco TOE. Conclusiones: Este trabajo es un punto de partida para la configuración de una herramienta que pueda ser usada por el departamento nacional de planeación en la evaluación a priori del retraso de megaproyectos de inversión pública. Abstract Context: The TOE (Technical, Organizational, and Environmental) framework for the analysis of large scale projects is considered as the basis for the development of megaproject progress classification in accordance with the needs of the national planning agency in Colombia. Method: Classification of a megaproject progress is supported in the selection of several features taken from the TOE. These feature set is used to configure a database from the projects registered in the project-surveillance platform of the national planning agency in Colombia. The database is used to train two classification models. Information about 3200 projects from 2008 to 2012 was used, covering four economic sectors (Environment and sustainable development, Energy and mining, Health and social care and transportation). Debugging of the database was carried out by an analytic and quantitative approach. Model training and validation were computed with 70 % and 30 % of data respectively. Results: Obtained models have similar performances beyond 70 % in precision and agree in relevant input features. Conclusions: This work is a starting point to develop an automatic tool that can be used by the national planning agency of Colombia in the a-priori evaluation of delays in public investment Megaprojects.
Published: 2017

21. Desarrollo de la lógica de unos componentes software para la predicción sobre series de tiempo

Author: Céspedes Sisniega, Jaime, Tirnauca, Cristina, Sierra Sánchez, Miguel, and Universidad de Cantabria
Subjects: Time series, Support vector machines, Industria 4.0, Machine learning, Redes neuronales, Máquinas de soporte vectorial, Industry 4.0, Series de tiempo, Aprendizaje automático, Neural networks
Abstract: RESUMEN: Hoy en día, con el avance en el ámbito de las tecnologías motivado en parte por la generación de grandes volúmenes de datos, son muchas las empresas que se plantean sacarles un rendimiento que les proporcione la información suficiente para una posterior toma de decisiones. Desde el punto de vista de la industria, estos avances permiten hacer uso de los datos recopilados a través de distintas fuentes de origen. Varias de estas fuentes de información se pueden encontrar en sensores o controladores lógicos programables (PLC). Por lo tanto, la industria en su denominada versión 4.0 tiene por objetivo proporcionar las herramientas necesarias para automatizar parte de su proceso a través del intercambio de información entre los distintos dispositivos que lo conforman, ya sean sensores, máquinas, servidores o sistemas de control y monitorización. En este trabajo se plantea desarrollar la lógica de una serie de componentes software para el producto de monitorización IDbox de la empresa CIC Consulting Informático, que sean capaces de realizar predicciones sobre series de tiempo. Para ello, el uso de algoritmos de aprendizaje automático facilita la generación de modelos matemáticos sobre los que obtener las predicciones. ABSTRACT: Nowadays, with the progress in the technology field motivated in part by the generation of large volumes of data, many companies are considering using this data to extract valuable information for further decition making policies. From an industry point of view, these advances allow to make use of the data collected from very different sources. Several of these information sources are represented by sensors or programmable logic controllers (PLCs). Therefore, the industry in its so-called version 4.0 aims to provide the necessary tools to automate part of its process through the information exchange between the different devices that make it up, such as sensors, machines, servers or control and monitoring systems. This work aims to develop the logic of a series of software components for the IDbox monitoring product of the CIC Consulting Informático for time series forecasting. For this, Machine Learning algorithms are used to generate mathematical models to obtain predictions. Grado en Ingeniería Informática
Published: 2017

22. Propuesta de un modelo estadístico para caracterizar y predecir la deserción estudiantil Universitaria

Author: Madrid Echeverry, Jorge Iván and Laniado Rodas, Henry
Subjects: Regresión logística, University Desertion, Discriminant Analysis, 62 Ingeniería y operaciones afines / Engineering, Deserción Universitaria, Support Vector Machines, Logistic Regression, Estadística Multivariada, Multivariate Statistics, Máquina Vector Soporte, Análisis Discriminante
Abstract: El objetivo de la investigación se fundamentó en utilizar técnicas estadísticas multivariadas: Máquinas Vector Soporte (SVM), Análisis Discriminante (AD), K-vecinos más próximos (KNN) y Regresión Logística (RL) para clasificar a los estudiantes de pregrado de la Universidad Nacional de Colombia Sede Medellín en dos poblaciones (con posibilidad o no de desertar) a partir de la información que se tenía disponible de las variables definidas e identificadas como determinantes de la deserción estudiantil Universitaria. Para el estudio se utilizó la información que suministraron los estudiantes que ingresaron a la Universidad Nacional de Colombia Sede Medellín desde el primer semestre del año 2009 hasta el primer semestre del año 2016, su correspondiente rendimiento académico en cada periodo matriculado y la identificación de cuáles de ellos perdieron la calidad de estudiante en la Universidad por bajo rendimiento y cuáles continuaron con sus estudios. Lo que permitió contar con un porcentaje de datos que fueron utilizados para el entrenamiento de los modelos y el resto de los datos como validación. Los resultados permitieron identificar la técnica que permite obtener el modelo con menor porcentaje de error y mayor sensibilidad, y que podría ser utilizada para hacer predicciones de deserción en nuevos individuos a partir de la información de las variables seleccionadas. Abstract: The objective of the research was based on the use of multivariate statistical techniques: support vector machines (SVMs), Discriminant Analysis, k-nearest neighbors (kNN) and Logistic Regression for classify the pregrade students of the Universidad Nacional de Colombia Sede Medellin in two Populations (with or without possibility of deserting) taking the information that was available of the variables defined and identified as determinants of student dropout For the study was used the information supplied by the students that entered in the National University of Colombia in Medellin from the first semester of 2009 until the second semester of 2016, their corresponding academic performance in each registered period and the identification of which of them lost de student quality in the university for poor performance and which of them continued with their studies. This allowed that was used a percentage of data for the training of the models and the rest of the data as validation. The results allowed identify the technique that allows obtain the model with lower percentage of error and greater sensitivity, and that could be used to make predictions of desertion in new individuals from the information of the selected variables. Maestría
Published: 2017

23. Aplicación de regresión conformal para la monitorización de aerogeneradores

Author: Rosario Custodio, Isis Caterina
Subjects: Energia eòlica, Conformal regression, Màquines de Suport Vectorial, Support Vector Machines, Máster Universitario en Ingeniería de Análisis de Datos, Mejora de Procesos y Toma de Decisiones-Màster Universitari en Enginyeria D'Anàlisi de Dades, Millora de Processos i Presa de Decisions, ESTADISTICA E INVESTIGACION OPERATIVA, Regresión conformal, Energía eólica, Wind energy, Máquinas de Soporte Vectorial, Regressió conformal
Abstract: In Spain, the wind energy sector has consolidated as one of the main sources of renewable energy with a coverage of demand of 19.4%. One of the objectives of the wind power sector is to ensure maximum availability of wind farms without increasing maintenance costs. A practical way to achieve this goal is to apply effective monitoring techniques. In this context, the present work aims to apply the conformal regression for the monitoring of wind turbines based on the information recorded in the Supervisory Control and Data Acquisition System (SCADA). The discrepancies between the observed and predicted data using the model could be indicative of the presence of faults or degradations in the components of the system. In order to evaluate this discrepancy a non-conformance measure is used which is obtained using the Support Vector Machine (SVM) as the underlying algorithm. Finally, a case of application to wind turbines of a wind farm located in Spain is presented., En España, el sector eólico se ha consolidado como una de las principales fuentes de energía renovable con una cobertura de la demanda del 19.4%. Uno de los objetivos del sector eólico es garantizar la máxima disponibilidad de los parques eólicos sin aumentar los costes de mantenimiento. Una forma práctica de conseguir este objetivo es la aplicación de técnicas de monitorización efectivas. En este contexto, el presente trabajo tiene por objetivo la aplicación de la regresión conformal para la monitorización de aerogeneradores a partir de la información registrada en el Sistema de Supervisión, Control y Adquisición de Datos (SCADA). Las discrepancias entre los datos observados y los predichos mediante el modelo podrían ser indicativos de la presencia de fallos o degradaciones en los componentes del sistema. Para evaluar dicha discrepancia se utiliza una medida de no conformidad la cual se obtiene utilizando como algoritmo subyacente Máquina de Soporte Vectorial (SVM). Finalmente, se presenta un caso de aplicación a aerogeneradores de un parque eólico situado en España., [CA] A Espanya, el sector eòlic s'ha consolidat com una de les principals fonts d'energia renovable amb una cobertura de la demanda del 19.4%. Un dels objectius del sector eòlic és garantir la màxima disponibilitat dels parcs eòlics sense augmentar els costos de manteniment. Una forma pràctica d'aconseguir aquest objectiu és l'aplicació de tècniques de monitoratge efectives. En aquest context, el present treball té per objectiu l'aplicació de la regressió conformal per al monitoratge d'aerogeneradors a partir de la informació registrada en el Sistema de Supervisió, Control i Adquisició de Dades (SCADA). Les discrepàncies entre les dades observades i els predits mitjançant el model podrien ser indicatius de la presència de fallades o degradacions en els components del sistema. Per a avaluar aquesta discrepància s'utilitza una mesura de no conformitat la qual s'obté utilitzant com a algorisme subjacent màquina de suport vectorial (SVM). Finalment, es presenta un cas d'aplicació a aerogeneradors d'un parc eòlic situat a Espanya.
Published: 2017

24. Análisis de sentimientos a nivel de aspecto usando ontologías y aprendizaje automático

Author: Carlos Henríquez, Pla Santamaría, Ferran, Hurtado Oliver, Lluis Felip, and Jaime Guzmán
Subjects: Support vector machines, Aspect-based sentiment analysis, Lenguajes y Sistemas Informáticos, Ontologies, Máquinas de soporte vecetorial, Máquinas de soporte vectorial, Análisis de sentimientos a nivel de aspecto, Ontologías, LENGUAJES Y SISTEMAS INFORMATICOS
Abstract: [EN] In this paper, we present an aspect-based sentiment analysis system that allows to automatically extract the characteristics of an opinion and to determine their associated polarity. The proposed system is based on a model that uses domain ontologies for the detection of aspects and a classifier based on the Support Vector Machines formalism for assigning the polarity to the detected aspects. The experimental work was conducted using the dataset developed for Task 5, Sentence-level ABSA in SemEval 2016 for Spanish. The proposed system has obtained a 73.07 in F1 in the aspect extraction subtask (slot2) and a 46.24 of F1 in the categorization and aspect extraction subtask (slot1,2) using an ontology-based approach. For the sentiment classification subtask (slot3) an 84.79% in terms of Accuracy has been obtained using an approach based on Support Vector Machines and polarity lexicons. These results are better than those reported in SemEval., [ES] En este artículo se presenta un sistema de análisis de sentimientos a nivel de aspecto que permite extraer automáticamente las características de una opinión y determinar la polaridad asociada. El sistema propuesto está basado en un modelo que utiliza ontologías de dominio para la detección de los aspectos y un clasificador basado en Máquinas de Soporte Vectorial para la asignación de la polaridad a los aspectos detectados. El trabajo experimental se ha realizado utilizando el conjunto de datos desarrollado para la Tarea 5, Sentence-level ABSA en SemEval 2016 para el español. El sistema propuesto ha obtenido un 73.07 en F1 en la extracción de aspectos (slot2) y un 46.24 de F1 en la subtarea conjunta de categorización y extracción de aspectos (slot1,2) utilizando una aproximación basada en ontologías. Para la subtarea de clasificación de sentimientos (slot3) se ha obtenido una Accuracy de 84.79 % utilizando una aproximación basada en el uso de Máquinas de Soporte Vectorial y lexicones de polaridad. Estos valores superan los mejores resultados obtenidos en SemEval., Este trabajo ha sido parcialmente subvencionado por el proyecto ASLP-MULAN: Audio, Speech and Language Processing for Multimedia Analytics (MINECO TIN2014-54288-C4-3-R y fondos FEDER). La estancia realizada, de enero a marzo de 2017, por Carlos Henríquez en la UPV, ha sido subvencionado por el programa Colciencias (convocatoria 727), Universidad Nacional de Medellín y Universidad Autónoma del Caribe Barran-quilla.
Published: 2017

25. Metodología para el diseño y la implementación de sensores inferenciales basados en datos de proceso, desarrollados con redes neuronales artificiales, sistemas neuro-difusos y máquinas de vectores de soporte

Author: Cote Ballesteros, Jorge Eduardo, Grisales Palacio, Victor Hugo, and Gil Chaves, Iván Darío
Subjects: Artificial neural network, Support vector machines, SVM, NARMAX, Modelo autorregresivo, Hill climbing, Sensores inferenciales, Mutual information, NARX, Hampel filter, 62 Ingeniería y operaciones afines / Engineering, Selección características, Feature selection, 6 Tecnología (ciencias aplicadas) / Technology, Sof-sensors, Filtrado, ANFIS, ANN, Outliers filtering
Abstract: El presente trabajo de tesis de maestría se desarrolló para el establecimiento de una metodología, que permita el diseño e implementación de sensores inferenciales basados en datos, bajo tres técnicas seleccionadas, por la creciente atención que vienen despertando en tareas de modelamiento y estimación de variables industriales. Las técnicas seleccionadas son las redes neuronales artificiales, las máquinas de vectores de soporte y los sistemas de inferencia neuro-difusa, que adicionalmente utilizan bases distintas para la solución del problema de regresión. Teniendo en cuenta lo anterior, se diseñaron 3 sensores inferenciales basados en estas técnicas, explorando las etapas necesarias para establecer una predicción de buen desempeño y por consiguiente diferentes técnicas para el preprocesamiento de los datos, selección de modelo y el entrenamiento y validación de las técnicas. Para llevar a cabo estas tareas se obtuvo el modelo matemático de una columna de destilación con el fin de acercar el entorno de simulación a datos con características típicas del ambiente industrial. Con el desarrollo de los 3 sensores inferenciales se estableció una metodología que puede ser aplicada en la industria y que desemboca en un desempeño adecuado para predecir variables de difícil o impráctica medición. Abstract: The present master's thesis work was developed for the establishment of a methodology, which allows the design and implementation of data-based inferential sensors, under three selected techniques. Due to the increasing attention they have been arousing in modeling and estimation of industrial variables. The techniques selected are artificial neural networks, support vector machines and neuro-diffuse inference systems, which additionally use different methods for the solution of the regression problem. Taking into account the above, 3 inferential sensors based on these techniques has been designed, by exploring the steps to establish a prediction of good performance and by means of different techniques for pre-processing of data, model selection and training of the techniques. To carry out these tasks, the mathematical model of a distillation column was obtained in order to bring the simulation environment closer to data with typical characteristics of the industrial environment. With the development of the 3 inferential sensors, a methodology was established that can be applied in the industry and that leads to adequate performance to predict variables of difficult or impractical measurement. Maestría
Published: 2017

26. Drug solubility prediction with support vector machines on graphic processor units

Author: Jose Garcia-Rodriguez, Alberto Garcia-Garcia, Jorge Peña-García, Alfonso Pérez-Garrido, H. Pérez-Sánchez, Sergio Orts, Gaspar Cano, Universidad de Alicante. Departamento de Tecnología Informática y Computación, Informática Industrial y Redes de Computadores, and Robótica y Visión Tridimensional (RoViT)
Subjects: Anàlisi numèrica, Graphic Processor Units, Bioinformatics, Applied Mathematics, General Engineering, Computational Biology, 02 engineering and technology, Bioinformática, 01 natural sciences, Matemàtiques i estadística::Anàlisi numèrica [Àrees temàtiques de la UPC], Unidades de Procesamiento Gráfico, 010104 statistics & probability, Support Vector Machines, 0202 electrical engineering, electronic engineering, information engineering, Biología Computacional, 020201 artificial intelligence & image processing, 0101 mathematics, Máquinas de Soporte Vectorial, Arquitectura y Tecnología de Computadores, Engineering(all), Numerical analysis
Abstract: En este trabajo se emplean métodos de inteligencia computacional, tales como las máquinas de soporte vectorial (MSV) para optimizar la predicción de la solubilidad de compuestos. Estas se entrenan con una base de datos de compuestos solubles e insolubles conocidos, y dicha información es posteriormente empleada para mejorar la predicción obtenida mediante cribado virtual. Los grandes avances en el campo de la computación de alto rendimiento ofrecen nuevas oportunidades en la simulación de sistemas biológicos y aplicaciones en bioinformática, biología computacional y química computacional. El uso de bases de datos de mayor tamaño aumenta las posibilidades en la generación de candidatos potenciales, pero el tiempo de cálculo necesario no sólo aumenta con el tamaño de la base de datos, sino también con la exactitud de los métodos de cribado virtual (CV) y del modelo. Se discuten los beneficios del uso de arquitecturas masivamente paralelas, en particular las unidades de procesamientos gráfico, demostrando empíricamente que están bien adaptadas para la aceleración de las MSV, obteniendo una aceleración de hasta 45 veces, en comparación con su versión secuencial. In this work we discuss the benefits of using computational intelligence methods, like Support Vector Machines (SVM) for the optimization of the prediction of compounds solubility. SVMs are trained with a database of known soluble and insoluble compounds, and this information is being exploited afterwards to improve Virtual Screening (VS) prediction. The landscape in the high performance computing arena opens up great opportunities in the simulation of relevant biological systems and for applications in bioinformatics, computational biology and computational chemistry. Larger databases increase the chances of generating hits or leads, but the computational time needed for the calculations increases not only with the size of the database but also with the accuracy of the VS methods and the model. We discussed the benefits of using massively parallel architectures, in particular graphics processing units. We empirically demonstrate that GPUs are well-suited architecture for the acceleration of SVM, obtaining up to 15 times sustained speedup compared to its sequential counterpart version. Este trabajo ha sido parcialmente financiado por los proyectos: NILS Mobility Project 012-ABEL-CM-2014A y Fundación Séneca 18946/JLI/13.
Published: 2017

27. Análisis del procesamiento de los datos de entrada para un localizador de fallas en sistemas de distribución

Author: Sandra Milena Pérez Londoño, Juan José Mora Flórez, and Walter Julián Gil González
Subjects: Computer science, lcsh:T, máquinas de soporte vectorial, attribute, atributos, normalization methods, Fault (power engineering), computer.software_genre, lcsh:Technology, support vector machines, Support vector machine, lcsh:TA1-2040, precisión y sistemas de distribución, Atributos, Data pre-processing, Data mining, Accuracy and power distribution systems, métodos de normalización, lcsh:Engineering (General). Civil engineering (General), computer
Abstract: En este artículo se presenta una comparación de cinco métodos de normalización de datos para un método de clasificación basado en la máquina de soporte vectorial (SVM), con el objetivo de determinar cuál es la influencia de éstos métodos en la precisión y el esfuerzo computacional del localizador de fallas en sistemas de distribución. La metodología propuesta se prueba en un sistema de distribución estándar de 34 nodos de la IEEE, el cual se subdivide en 11 zonas, de donde se obtiene una base de datos de 6442 registros de falla monofásica a diferentes condiciones de carga. La comparación de estos métodos de normalización muestra que el método Min-Max presentó un mejor rendimiento en tiempo computacional y precisión promedio del localizador de fallas, en los casos estudiados. Aimed to determine the effect of data normalization on the accuracy and the computational effort of a fault locator based on support vector machines (SVM), a comparison of five different data preprocessing strategies are analyzed in this paper. The proposed methodology is tested on an IEEE 34-bus test feeder, which is subdivided in eleven zones, by using a database of 6442 single-phase to ground faults obtained under different load conditions. Considering the testing scenarios, the comparison of the proposed preprocessing methods shows that Min-Max method has the best performance mainly considering computational effort and average accuracy on the fault locator.
Published: 2014

28. Implementación de algoritmos basados en máquinas de soporte vectorial (SVM) para sistemas eléctricos: revisión de tema

Author: Jefferson Jara Estupiñan, Diego Giral, and Fernando Martínez Santa
Subjects: electricidad, aprendizaje de máquina, machine learning, Algoritmos, lcsh:T, lcsh:TA1-2040, máquinas de soporte vectorial, Algoritmos, aprendizaje de máquina, máquinas de soporte vectorial, electricidad, electricity, lcsh:Engineering (General). Civil engineering (General), lcsh:Technology, Algorithms, support vector machines
Abstract: Objetivo: Realizar una revisión sobre la implementación de algoritmos basados en máquinas de soporte vectorial para sistemas eléctricos. Método: Se realiza una búsqueda de artículos principalmente en Índices bibliográficos (IB) y Bases Bibliográficas con Comité de Selección (BBCS) acerca de las máquinas de soporte vectorial. Este trabajo presenta una descripción cualitativa y/o cuantitativa acerca de los avances y aplicaciones en el entorno eléctrico, abordando temas como: predicción del mercado eléctrico, predicción de la demanda, perdidas no técnicas de electricidad (hurto), energías alternativas, trasformadores, entre otros; en cada trabajo se realiza la respectiva citación con el fin de garantizar los derechos de autor y permitirle al lector el movimiento dinámico entre lo consignado en este trabajo y los trabajos citados . Resultados: Se realiza la revisión de una manera detallada, centrando la búsqueda en algoritmos implementados en sistemas eléctricos y en áreas de aplicación novedosas. Conclusión: Las máquinas de soporte vectorial tienen bastantes aplicaciones debido a sus múltiples beneficios, sin embargo en el área de energía eléctrica, estas no se han aplicado en su totalidad, esto permite identificar un área prometedora de trabajos de investigación. Objective: To perform a review of implementation of algorithms based on support vectore machine applied to electric systems. Method: A paper search is done mainly on Bibliographic Indexes (BI) and Bibliographic Bases with Selection Committee (BBSC) about support vector machine. This work shows a qualitative and/or quantitative description about advances and applications in the electrical environment, approaching topics such as: electrical market prediction, demand prediction, non-technical losses (theft), alternative energy source and transformers, among others, in each work the respective citation is done in order to guarantee the copy right and allow to the reader a dynamic movement between the reading and the cited works. Results: A detailed review is done, focused on the searching of implemented algorithms in electric systems and innovating application areas. Conclusion: Support vector machines have a lot of applications due to their multiple benefits, however in the electric energy area; they have not been totally applied, this allow to identify a promising area of researching.
Published: 2016

29. GPU computing framework to support high-dimensional data analysis: application to video based object tracking

Author: Triana Martinez, Jenniffer Carolina, Castellanos Domínguez, César German (Thesis advisor), and Alvarez Meza, Andres Marino (Thesis advisor)
Subjects: Rastreo, Support vector machines, Programación en GPU, Tracking, 0 Generalidades / Computer science, information and general works, Haar-Like features, Máquinas de soporte vectorial, GPU programming, Características Haar-Lee, Detección, Detection, 62 Ingeniería y operaciones afines / Engineering, Análisis de relevancia, Computer vision, Visión por computador, Relevance analysis
Abstract: En este trabajo, un esquema de computo GPU es propuesto. El principal objetivo de dicho esquema es dar a conocer adecuadamente la información ms relevante a partir de un conjunto de datos de alta dimensión para mejorar el rendimiento de los principales enfoques dentro del área de visión por computador: detección de objetos basado en vídeo y seguimiento. Con este fin, se propone diseñar e implementar un esquema de cómputo GPU con el fin de tratar con el problema del seguimiento y la detección de objetos a través de la aplicación de técnicas de procesamiento de imágenes y técnicas de aprendizaje automático para as explotar el paralelismo masivo hilo dentro de la GPU. Por lo tanto, nuestro objetivo es mejorar la precisión y robustez del sistema y reducir los problemas de carga computacional. El esquema presentado se divide en tres etapas principales: En primer lugar, un enfoque de extracción de características implementadas en la GPU se propone con el fin de explotar la arquitectura multinúcleo y el desempeño de alto rendimiento masivamente paralelo haciendo uso del modelo de programación CUDA. A continuación, se compara el rendimiento del enfoque paralelo que se ejecuta en la GPU con la aplicación CPU secuencial con el fin de demostrar el aumento de velocidad y la eficacia de nuestras estrategias paralelas. En segundo lugar, una metodología de selección de características se presenta para estimar las características Haar-Like relevantes en la detección de objetos basado en vídeo y sistemas de seguimiento. Nuestra propuesta emplea un criterio de variabilidad y un método de Eigen-descomposición para identificar un subconjunto de características Haar-Like como expositoras de información discriminativa. De este modo, la representación proporcionada permite mejorar la separabilidad de las muestras, evitando al mismo tiempo la información redundante. En tercer lugar, la detección de objetos en el mundo real y el seguimiento problema se prueba. En concreto, el método propuesto se implementa para la detección de automóviles y la localización usando algunas secuencias de video e imágenes de internet para entrenar el sistema. Diferentes características Haar-Like se extraen de cada muestra y nuestro método de selección de características es llevado a cabo para garantizar una exactitud del sistema que tienen las características Haar-Like ms relevantes utilizando una máquina de vectores de soporte clasificador con fines de discriminación. Una vez extraído el modelo fuera de línea se implementa en C ++ también para validar el sistema en condiciones de tiempo real en algunos vídeos de vigilancia y escenas de carretera obtenidos de Internet. Los resultados obtenidos muestran cómo nuestro enfoque permite conseguir actuaciones aceptables en comparación con los algoritmos del estado del arte para la detección de objetos basado en vídeo y seguimiento mediante la formación fuera de línea. Por otra parte, nuestra metodología de análisis de relevancia es útil para poner de relieve las principales dependencias de pixeles en el modelado de un objeto dado Abstract : In this work, a GPU Computing Framework is proposed. Our main goal is to properly reveal the most relevant information from high-dimensional data for enhancing the performance of two different computer vision approaches: video based object detection and tracking. To this end, we propose to design and implement a GPU computing framework in order to deal with the tracking and detection problem through the implementation of image processing and machine learning techniques to exploits the massive thread parallelism within the GPU. Hence, we aim to enhance the accuracy and robustness of the system and to reduce computational burden issues. The introduced framework is divided in three main stages: First, a feature extraction approach implemented on GPU is proposed in order to exploits the multicore architecture and the massively parallel high performance trough the use of the NIVIDA CUDA programming model. Then, We compare the performance of the parallel approach running on the GPU with the sequential CPU implementation in order to demonstrate the speedup and effectiveness of our parallel strategies. Second, a feature selection methodology is presented to estimate relevant Haar-like characteristics in video-based object detection and tracking systems. Our proposal employs a variability criterion and an eigendecomposition method to identify a subset of Haar-like features exhibiting discriminative information. Thereby, provided representation allows enhancing samples separability while avoiding redundant information. Third, a real-world object detection and tracking problem is tested. Specifically, proposed method is implemented for car detection and tracking using some World Wide Web video and image sequences to train the system. Different Haar-like features are extracted from each sample and our feature selection method is carry out to ensure a suitable system accuracy with the most relevant Haar-feature using a Support Vector Machine classifier for discrimination purposes. Computed off-line model is implemented in C++ also to validate the system in real-time conditions in some surveillance and highway scenes videos obtained from internet to. Attained results show how our approach allows achieving acceptable performances in comparison to state-of-the-art algorithms for videobased object detection and tracking using off-line training. Moreover, our relevance analysis methodology is useful for highlighting the main pixel dependencies when modeling a given object Maestría
Published: 2016

30. Optimización de algoritmos para la estimación de niveles de llenado de contenedores

Author: Ruiz Bolado, Jesús., Ibáñez Díaz, Jesús María, and Universidad de Cantabria
Subjects: Optimización convexa, Sensor networks, Ultrasounds, Support vector machines, Machine learning, Máquina de vectores soporte, Aprendizaje máquina, Ultrasonidos, Redes de sensores, Convex optimization
Abstract: Grado en Ingeniería de Tecnologías de Telecomunicación
Published: 2015

31. Un algoritmo para el entrenamiento de máquinas de vector soporte para regresión

Author: Sergio Gerardo De los Cobos Silva, John Goddard Close, Miguel Ángel Gutiérrez Andrade, and Blanca Rosa Pérez Salvador
Subjects: regresión ε-vector soporte, business.industry, Computer science, Materials Science (miscellaneous), lcsh:Mathematics, Support vector Machines, lcsh:QA1-939, Industrial and Manufacturing Engineering, Regression, Support vector machine, ε−support vector regression, Artificial intelligence, Quadratic programming, Business and International Management, business, Algorithm, Máquinas de vector soporte, SIMPLE algorithm
Abstract: The aim of the present paper is twofold. Firstly an introduction to the ideas of Support Vector regression is given. then a new and simple algorithm, suggested by the work of Campbell y Cristianini in [16], is proposed which solves the corresponding quadratic programming problem in an easy fashion. The algorithm is illustrated by example and compared with classical regression. El propósito del presente artículo es doble. Primero se proporciona una introducción a las ideas básicas de la Máquinas de Vector Soporte para regresión. Posteriormente, se presenta un algoritmo novedoso y sencillo, basado en el trabajo de Campbell y Cristianini [16], que resuelve de manera fácil el correspondiente problema de programación cuadrática. Se ilustra el algoritmo con ejemplos, y se compara con el método de regresión clásico.
Published: 2009

32. Clasificación digital de masas nubosas a partir de imágenes meteorológicas usando algoritmos de aprendizaje de máquina Digital

Author: Ramírez-Fernández, Salomón Einstein and Lizarazo-Salcedo, Iván Alberto
Subjects: random forests, decision trees, algoritmos de aprendizaje de máquina, machine learning algorithms, máquinas de soporte vectorial, weather images, bosques aleatorios, Clasificación de masas nubosas, árboles de decisión, support vector machines, imágenes meteorológicas, cloud mass classification
Abstract: La identificación exacta de nubes precipitantes es una tarea difícil. En el presente trabajo se aplicaron los algoritmos Máquinas de Soporte Vectorial, Árboles de Decisión y Bosques Aleatorios para discriminar entre nubes precipitantes y nubes no precipitantes, a partir de una imagen meteorológica del satélite GOES-13 que cubre el territorio colombiano. El objetivo del trabajo fue evaluar el desempeño de los algoritmos de aprendizaje de máquina (ML), para la clasificación digital de masas nubosas, en términos de la exactitud temática de la clasificación usando como referencia el algoritmo convencional distancia de Mahalanobis. Los resultados muestran que los algoritmos ML proporcionan una clasificación de masas de nubes más exacta que la obtenida por algoritmos convencionales. La mejor exactitud fue obtenida usando Bosques Aleatorios (RF), con una exactitud temática global de 97%. Adicionalmente, la clasificación obtenida con RF fue comparada pixel a pixel con estimaciones de precipitación de la NASA Tropical Rainfall Measurement Mission (TRMM) obteniendo una exactitud global del 94%. De acuerdo con este estudio, los algoritmos ML pueden ser usados para mejorar los actuales métodos de identificación de nubes precipitantes. Accurate identification of precipitating clouds is a challenging task. In the present work, Support Vector Machines, Decisión Trees and Random Forests algorithms were applied to discrimínate between precipitating clouds and non-precipitating clouds from a satellite weather image GOES- 13 covering the Colombian territory. The objective of this study was to evaluate the performance of machine learning (ML) algorithms for digital classification of cloud masses in terms of thematic accuracy classification using the conventional Mahalanobis algorithm as benchmark. Results show that ML algorithms provide more accurate classification of cloud masses than conventional algorithms. The best accuracy was obtained using Random Forests (RF), with an overall thematic accuracy of 97%. Furthermore, the classification obtained with the RF algorithm was compared pixel-to-pixel with NASA Tropical Rainfall Measurement Mission (TRMM) rainfall estimates, obtaining an overall accuracy of 94%. ML algorithms can therefore be used to improve current precipitating clouds identification methods.
Published: 2014

33. Comparación entre métodos para clasificación usando algunas distribuciones multivariadas

Author: Cortés Vélez, Catalina Inés and Salazar Uribe, Juan Carlos
Subjects: Regresión logística, Support vector machines, 51 Matemáticas / Mathematics, Linear dis-criminant analysis, False discovery rate, Análisis discriminante lineal, Tasa de clasificación errónea, Logistic regression, Clasificación, Máquinas de soporte vectorial, Classification
Abstract: El problema de establecer similitudes o diferencias en áreas como la genética, biología, ciencias médicas, ingeniería, entre otras, es llamado problema de clasificación, consiste en asignar una pertenencia a determinado individuo ya sea por sus características, orden o estructura. En un trabajo previo Salazar, Vélez y Salazar comparan vía simulación la eficiencia de las máquinas de soporte vectorial y la Regresión Logística, para datos que necesiten la clasificación en dos grupos y que posean una distribución univariada. En este trabajo se compara la eficiencia de Regresión Logística, Máquinas de Soporte Vectorial, Análisis Discriminante y Clasificador Fuzzy, para clasificar un grupo de datos en dos categorías mutuamente excluyentes, en el escenario de datos multivariados provenientes de poblaciones con distribución normal multivariada, normal asimétrica y t multivariada. Dicha eficiencia o desempeño se medirá con la tasa de clasificación errónea. medical sciences, engineering, just to mention some of them is known as classification. This process consists on assigning a subject to a specific group according to his/her features, order or structure. In a previous work, Salazar and Salazar compared the efficiency of both Support Vector Machines -SVM- and Logistic Regression -LR-, using two groups and univariate distributions by means of a simulation study. In this work, we compare the efficiency of the following classifiers to classify a dataset in two category mutually exclusive: Support Vector Machines -SVM-, Logistic Regression - LR-, Discriminant Analysis -DA- and Fuzzy Classifier. The comparison is carried out using multivariate data coming from several multivariate populations. Such efficiency is measured through the False Discovery Rate -FDR-. Maestría
Published: 2014

34. Análisis comparativo de metaheurísticas para calibración de localizadores de fallas en sistemas de distribución

Author: Gil-González, Walter J., Mora-Flórez, Juan J., and Pérez-Londoñ, Sandra
Subjects: Calibración, Técnicas metaheurísticas, Calibration, Sistemas de distribución, fault locator, Máquinas de soporte vectorial, power distribution system, Localización de fallas, support vector machines, metaheuristics techniques
Abstract: En este artículo se presenta un análisis comparativo de cuatro técnicas metaheurísticas que permiten la calibración óptima de un localizador de fallas basado en máquinas de soporte vectorial (MSV), con el objetivo de determinar cuáles técnicas presentan un mejor rendimiento para este problema. El localizador propuesto se prueba en un sistema de distribución estándar de 34 nodos de la IEEE, en el que se obtienen precisiones promedio para las mejores alternativas de 99%, utilizando una base de datos de 13824 registros de fallas monofásicas, bifásicas, bifásicas a tierra y trifásicas. La comparación de las alternativas de parametrización muestra que las técnicas metaheurísticas basadas en población presentaron un mejor rendimiento que aquellas basadas en trayectoria, en todos los casos estudiados In this paper, a comparative analysis on the use of four metaheuristics for obtaining an optimal adjustment of a fault locator based on support vector machines (SVM), is presented. This research is aimed to determine those techniques which help to obtain the best performance at the specific problem of fault location. The proposed fault locator is tested in the 34 nodes IEEE power distribution system where the average precision obtained considering the best alternatives is around 99%, using a database of 13824 registers from single phase, phase to phase, two phase to ground and three phase faults. The comparison of the parameterization alternatives shows how those metahueristics based on population have better performance that those based on trajectory, having a good performance in all of the tested situations
Published: 2013

35. Categorización de Textos mediante Máquinas de Soporte Vectorial

Author: Cortez Vasquez, Augusto, Pró Concepción, Luzmila, Rojas Lazo, Oswaldo, and Calmet Agnelli, Robero
Subjects: clasificadores lineales, text classification, text categorization, Categorización de textos, máquinas de soporte vectorial, linear classifiers, support vector machines, clasificación de textos
Abstract: The categorization of texts is an application that falls within the discipline of naturallanguage pro cessing and is closely related to the concept of classification. Due to the abundant existing infor mation becomes necessary to organize, maintain, and process any information available from a deeper knowledge of the language of the support vector machines (MSV) belong to the family of linear classifiers, and can be used to resolve the problem of the categorization of texts(eT) which consists in label text or document with one or severa! predefined thematic categories. The reason which tackles the problem is their application in different scenarios of the area of information retrie val (IR) such as the automatic organization of documents, filtering of documents. The approach of the MSV basically considers the following: Given a set of documents D anda set of categories e, it is important to find a function that match toa document d taken from D, a particular category e in C., La categorización de textos es una aplicación que se enmarca dentro de la disciplina de lenguaje de procesamiento natural y está estrechamente relacionado con el concepto de clasificación. Debido a la abundante información existente se hace necesario organizar, mantener y procesar toda infor mación disponible a partir de un conocimiento más profundo del lenguaje. Las máquinas de soporte vectorial (MSV) pertenecen a la familia de clasificadores lineales, y puede utilizarse para resolver el problema de la categorización de textos(eT) que consiste en etiquetar un texto o documento con•una o varias categorías temáticas predefinidas. La razón por la cual se aborda el problema es su aplicación en diversos escenarios del área de recuperación de información (RI) tales como la organización automática de documentos, filtrado de documentos. El enfoque de las MSV considera fundamentalmente lo siguiente: El objetivo es crear un modelo que permita etiquetar un texto con una categoría predefinida dado un conjunto de documentos D y un conjunto de categorías e, se trata de encontrar una función que haga corresponder a un documento d tomado de D, una cate goría determinada e en C.
Published: 2013

36. Agrupamiento espectral de datos dinamicos

Author: Peluffo Ordoñez, Diego Hernán and Castellanos Domínguez, César Germán
Subjects: Aprendizaje automático (inteligencia artificial), Optical pattern recognition, primal-dual formulation, 0 Generalidades / Computer science, information and general works, máquinas de vectores de soporte, datos dinámicos o variantes en el tiempo, kernels, dynamic or time-varying data, support vector machines, análisis, formulación primal-dual, Machine learning, Spectral clustering, Reconocimiento óptico de modelos, Agrupamiento espectral, cluster analysis
Abstract: El análisis de datos dinámicos o variantes en el tiempo es un tema de gran interés actual para la comunidad científica, especialmente, en los campos de reconocimiento de patrones y aprendizaje de máquina. Existe un amplio espectro de aplicaciones en donde el análisis de datos dinámicos toma lugar, tales como el análisis de video, la identificación de movimiento, la segmentación de movimientos de personas y el seguimiento de naves aéreas, entre otras. Una de las alternativas para desarrollar métodos dinámicos es el análisis matricial espectral. Las técnicas espectrales, principalmente aquellas basadas en kernels, han demostrado su alta aplicabilidad en diversos aspectos del reconocimiento de patrones y aprendizaje de máquina, incluso cuando los datos son variantes en el tiempo, tales como la estimación del número de grupos, agrupamiento y clasificación. La mayoría de los métodos espectrales han sido diseñados para el análisis de datos estáticos, descartando la información temporal, es decir, omitiendo el comportamiento y la evolución de los datos a lo largo del tiempo. En el estado del arte se encuentran algunos trabajos que consideran el efecto de la variación en el tiempo,sin embargo, el diseño de un método que permita seguir la dinámica de los datos y agrupar los mismos en ambientes de tiempo real, con alta ﬁdelidad y precisión, es aún un problema abierto. En este trabajo de tesis se presenta un método de agrupamiento espectral basado en kernels diseñado a partir de un enfoque primal-dual con el ﬁn de realizar el proceso de agrupamiento considerando la información dinámica, es decir, los cambios de secuencia de los datos a lo largo del tiempo. Para este propósito, se plantea un esquema de agrupamiento que consiste en la extensión de una formulación primal-dual al análisis de datos dinámicos a través de un kernel dinámico. El esquema se basa en un aprendizaje de múltiples kernels (MKL) y se denomina dynamic kernel spectral clustering (DKSC). El método DKSC usa como modelo de MKL una combinación lineal de matrices kernel. Las matrices kernel se calculan a partir de una secuencia de datos representada por un conjunto de matrices de datos. Subsecuentemente, se obtiene una matriz acumulada de kernel de tal forma que los coeﬁcientes o factores de ponderación del modelo son considerados como valores de evaluación de cada muestra del conjunto de datos o frame. Dicha evaluación se hace a partir de un novedoso método de tracking que se basa en la descomposición espectral de una matriz kernel generalizada. Finalmente, para la obtención de las asignaciones de grupo resultantes, los datos son agrupados usando la matriz acumulada como matriz kernel. Abstract : The analysis of dynamic or time-varying data has emerged as an issue of great interest taking increasingly an important place in scientiﬁc community, especially in automation, pattern recognition and machine learning. There exists a broad range of important applications such as video analysis, motion identiﬁcation, segmentation of human motion and airplane tracking, among others. Spectral matrix analysis is one of the approaches to address this issue. Spectral techniques, mainly those based on kernels, have proved to be a suitable tool in several aspects of interest in pattern recognition and machine learning even when data are time-varying, such as the estimation of the number of clusters, clustering and classiﬁcation. Most of spectral clustering approaches have been designed for analyzing static data, discarding the temporal information, i.e. the evolutionary behavior along time. Some works have been developed to deal with the time varying effect. Nonetheless, an approach able to accurately track and cluster time-varying data in real time applications remains an open issue. This thesis describes the design of a kernel-based dynamic spectral clustering using a primaldual approach so as to carry out the grouping task involving the dynamic information, that is to say, the changes of data frames along time. To this end, a dynamic kernel framework aimed to extend a clustering primal formulation to dynamic data analysis is introduced. Such framework is founded on a multiple kernel learning (MKL) approach. Proposed clustering approach, named dynamic kernel spectral clustering (DKSC) uses a linear combination of kernels matrices as a MKL model. Kernel matrices are computed from an input frame sequence represented by data matrices. Then, a cumulative kernel is obtained, being the model coefficients or weighting factors obtained by ranking each sample contained in the frame. Such ranking corresponds to a novel tracking approach that takes advantages of the spectral decomposition of a generalized kernel matrix. Finally, to get the resultant cluster assignments, data are clustered using the cumulative kernel matrix. Experiments are done over real databases (human motion and moon covered by clouds)as well as artiﬁcial data (moving-Gaussian clouds). As a main result, proposed spectral clustering method for dynamic data proved to be able for grouping underlying events and movements and detecting hidden objects as well. The proposed approach may represent a contribution to the pattern recognition ﬁeld, mainly, for solving problems involving dynamic information aimed to either tracking or clustering of data. Doctorado
Published: 2013

37. Propuesta para la identificación y monitoreo de áreas débiles con relación a la estabilidad de tensión en sistemas eléctricos de potencia

Author: Pérez Londoño, Sandra Milena and Olivar Tost, Gerard (Thesis advisor)
Subjects: Voltage stability, Estabilidad de tensión, Support vector machines, Voltage control area, 62 Ingeniería y operaciones afines / Engineering, Stability index, Área de control de tensión, Aprendizaje de máquina, Learning machine, Máquinas de soporte vectorial, Índice de estabilidad, Electrical measurements, Mediciones eléctricas
Abstract: El monitoreo permanente es indispensable en los sistemas eléctricos de potencia, para determinar si éstos se encuentran funcionando dentro de los estándares y límites de seguridad establecidos, para mantener adecuadamente su estabilidad. Por lo tanto, se debe suministrar a los operadores del sistema eléctrico de potencia, herramientas adecuadas, de fácil implementación y utilización, que permitan definir oportunamente las acciones pertinentes de prevención y/o control. Por esta razón, en esta tesis se propone una metodología basada en técnicas de aprendizaje de máquina, que emplea mediciones del sistema de potencia, para la identificación de áreas sensibles o críticas, donde existen altos riesgos de experimentar problemas de estabilidad de tensión. Inicialmente, para la determinación de la condición de operación del sistema y basado en una extensa revisión bibliográfica, se propone un nuevo índice denominado SVSI (Simplified Voltage Stability Index), el cual emplea la topología y las mediciones del sistema eléctrico de potencia, para determinar la estabilidad de tensión en las barras. El principal aporte del índice propuesto está asociado con la utilización de la matriz distancia eléctrica relativa y de factores de sensibilidad basados en variables del sistema eléctrico de potencia. Esta propuesta permite el cálculo rápido de un índice y con un bajo costo computacional, comparado con otras propuestas. Posteriormente, con la informacion suministrada por el índice propuesto y mediante la utilización de técnicas asociadas con campos como la minería de datos y del aprendizaje de máquina, se desarrolla un esquema de identificación y monitoreo en línea de áreas débiles o críticas en estabilidad de tensión, basado solo en mediciones eléctricas en el sistema. La validación de las propuestas obtenidas como consecuencia del desarrollo de esta investigación, se realiza mediante la aplicación exitosa en los sistemas eléctricos de potencia IEEE de 14, 30 y 118 barras Abstract : Nowadays, the power systems are being operated at the boundaries of the safe region, and then the probability of occurrence of stability problems is high. In case of dangerous events, the system operators require of a timely situational awareness to have enough of time to determine the best corrective controls, which help to assure the power system security. This thesis proposes a methodology based on machine learning techniques, which uses measurements for the identification of sensitive or critical areas where exist a high risk of experience voltage stability problems. Initially, to determine the operating condition of the analized power system system and based on an extensive literature review, a new index called SVSI (Simplified Voltage Stability Index) is proposed, using only the system topology and power system measurements. The main contribution of the proposed index is associated with the use of relative electrical distance matrix and sensitivity factors based on the variables of the power system. This proposal allows the fast calculation of an index and has a low computational cost compared to other proposals. Next and by using the information supplied by the proposed index and also techniques from data mining and learning machine areas, an online identification and monitoring system is developed, using only measurements of power system variables. The validation of the proposals obtained as a result of the development of this research, is performed by the succesful application at the electric power systems identified as IEEE 14, 30 and 118 buses Doctorado
Published: 2013

38. Máquinas de soporte vectorial sobre conjuntos de datos no balanceados: propuesta de un nuevo sesgo

Author: Núñez Castro, Haydemar, González Abril, Luis, Angulo Bahón, Cecilio|||0000-0001-9589-8199, Universitat Politècnica de Catalunya. Departament d'Enginyeria de Sistemes, Automàtica i Informàtica Industrial, and Universitat Politècnica de Catalunya. GREC - Grup de Recerca en Enginyeria del Coneixement
Subjects: Machine learning--Mathematical models, Sistemes experts (Informàtica) -- Autoaprenentatge, Informàtica::Intel·ligència artificial::Aprenentatge automàtic [Àrees temàtiques de la UPC], Support vector machines, Enginyeria electrònica::Microelectrònica::Sistemes digitals programables [Àrees temàtiques de la UPC], Aprenentatge automàtic -- Algorismes
Abstract: En el aprendizaje con conjuntos de datos no balanceados, la máquina de soporte vectorial (SVM) puede exhibir un bajo rendimiento sobre la clase minoritaria ya que, como otras máquinas de aprendizaje, están diseñadas para inducir un modelo de clasificación basado en un error global. Con el fin de mejorar su desempeño en este tipo de problemas, en este trabajo se propone una estrategia de post-procesamiento basada en el cálculo de un nuevo sesgo o umbral que toma en cuenta la proporción de las clases en el conjunto de datos y que permite ajustar la función aprendida por la SVM para mejorar su desempeño sobre la clase minoritaria. Esta solución no supone la entonación de nuevos parámetros ni la modificación del problema de optimización estándar para entrenar la SVM. Los resultados obtenidos de la experimentación sobre 23 conjuntos de datos con diferentes grados de desbalance, muestran que efectivamente se logra mejorar las clasificaciones sobre la clase minoritaria, medidas en función de g-media y la sensibilidad.
Published: 2012

39. Predicción de la estructura secundaria de proteínas usando Máquinas de soporte Vectorial

Author: Delgado, D. J, Arguello, H, and Torres, R
Subjects: prediction of protein secondary structure, metodología de codificación, máquinas de soporte vectorial, predicción de la estructura secundaria de proteínas, coding methodology, support vector machines
Abstract: Entre los métodos computacionales utilizados para la predicción de la estructura secundaria de proteínas, se destaca el uso de máquinas de soporte vectorial. Este trabajo de investigación presenta la predicción de la estructura secundaria de proteínas desde su secuencia primaria de aminoácidos usando Máquinas de Soporte Vectorial. Como entradas, en la metodología propuesta, se utilizan características de los diferentes motivos estructurales o cadenas de texto asociadas a la estructura primaria que representa la estructura secundaria, tales como el R-grupo y la probabilidad de que el aminoácido en la posición central adopte una determinada estructura secundaria. Para la extracción de características se utiliza un método de codificación de secuencias en el que cada símbolo en la estructura primaria se relaciona con cada símbolo en la estructura secundaria. El uso de este método de codificación permite reducir la dimensionalidad de los datos de miles de características a sólo 220 de estas. Los resultados obtenidos son comparables a los registrados en la literatura, teniendo cerca de un 70% de precisión. Además, se logra reducir los costos computacionales en la construcción de los clasificadores debido a que este trabajo modela el problema de multi-clasificación como un grupo de clasificadores binarios. Among the computational methods used for predicting secondary structure proteins highlights the use of support vector machines. This research shows the predicted secondary structure of protein from its primary amino acid sequence using Support Vector Machines. As inputs, in the proposed methodology, features are used from different structural motifs or text strings associated with the primary structure which represents the secondary structure, such as R-group and the probability that the amino acid at position adopts a central particular secondary structure. For feature extraction method is used coding of sequences in which each symbol in the primary structure is associated with each symbol in the secondary structure. The use of this encoding method reduces the dimensionality of the data of thousands of characteristics only 220 of these. The results obtained are comparable to those reported in the literature, taking about 70% accuracy. Furthermore, it is possible to reduce computational cost in the construction of classifiers because this work models the problem of multi classification as a group of binary classifiers.
Published: 2012

40. Clasificación acústica de anchoveta (Engraulis ringens) y sardina común (Strangomera bentincki) mediante máquinas de vectores soporte en la zona centro-sur de Chile: efecto de la calibración de los parámetros en la matriz de confusión

Author: Robotham, Hugo, Bosch, Paul, Castillo, Jorge, and Tapia, Ignacio
Subjects: anchovy, pelagic fishes, anchoveta, hidroacústica, máquinas de vectores soporte, clasificación de especies, sardina, species classification, Chile, peces pelágicos, sardine, support vector machines, hydroacoustics
Abstract: Se clasificó la anchoveta (Engraulis ringens) y sardina común (Strangomera bentincki) detectadas mediante equipos acústicos en la zona centro-sur de Chile, mediante el método de Máquinas de Vectores Soporte (SVM). Para esto se utilizaron descriptores de cardúmenes extraídos desde ecogramas, que fueron clasificados como morfológicos, batimétricos, energéticos y posicional espacial. Para lograr clasificaciones precisas mediante la utilización de esta metodología, fue necesario optimizar parámetros correspondientes al Kernel-Gaussiano, γ y de penalización del modelo C, mediante el análisis del efecto de la calibración sobre las matrices de confusión resultantes de la clasificación de las especies analizadas. El método SVM ajustó correctamente el 95,3% de los cardúmenes de anchoveta y sardina común. Los parámetros óptimos del Kernel-Gaussiano γ y de penalización C obtenidos mediante la metodología propuesta fueron γ = 450 y C = 0,95, respectivamente. Los parámetros mencionados incidieron de manera importante en la matriz de confusión y los porcentajes de clasificación final, por lo que se sugiere establecer, en aplicaciones futuras de este método, un protocolo experimental de calibración. La sardina común fue la especie con menor error de clasificación en el conjunto de las matrices de confusión. El descriptor correspondiente a profundidad del fondo fue el más sensible al SVM, la segunda variable en importancia es el descriptor distancia a la costa. The support vector machines (SVM) method was used to classify the anchovy (Engraulis ringens) and common sardine (Strangomera bentincki) species detected in south-central Chile by means of acoustic equipment. For this, descriptors of fish schools (morphology, bathymetry, energy, spatial position) extracted from ecograms were used. In order to obtain precise classifications using this methodology, it was necessary to optimize the parameters Gaussian-Kernel γ and penalty term C by analyzing the effect of the calibration on the confusion matrices resulting from the classification of the species under study. The SVM method correctly classified 95.3% of anchovy and sardine schools. The optimal parameters of the Gaussian-Kernel γ and penalty C obtained with the proposed methodology were γ = 450 and C = 0.95. These parameters have an important influence over the confusion matrix and the final classifications percentages, suggesting the development of experimental protocols for calibrating these parameters in future applications of this methodology. In all the confusion matrices, the common sardine showed the lowest classification error. The bottom depth was the descriptor that was most sensitive to the SVM, followed by school-shore distance.
Published: 2012

41. Emg-based system for basic hand movement recognition

Author: JHONATAN CAMACHO NAVARRO, FABIAN LEÓN-VARGAS, and JAIME BARRERO PÉREZ
Subjects: lcsh:TN1-997, hand-prosthesis, discrete wavelet transform, lcsh:T, Electromyography, principal component analysis, pattern recognition, lcsh:Technology, lcsh:Mining engineering. Metallurgy, support vector machines
Abstract: Este artículo presenta un sistema que permite identificar de forma automática, en sujetos sanos, y haciendo uso de señales electromiográficas superficiales en estado estable, los siguientes movimientos básicos de la mano: apertura, cierre, flexión, extensión, pronación y supinación, incluyendo la condición de reposo. La discriminación de los diferentes movimientos se realiza a partir de una metodología modular de reconocimiento de patrones que incluye el uso de la transformada wavelet discreta, análisis de componentes principales y máquinas de soporte vectorial. La identificación fue realizada off-line cada 256 ms mediante una interfaz hardware-software conformada por un sistema de adquisición de señales de dos canales diferenciales y algoritmos programados en Matlab® y LabVIEW®. El sistema fue entrenado y evaluado para cinco sujetos de diferente género, edad y complexión física, obteniendo tasas de acierto de hasta el 99.25 %.
Published: 2012

42. Mediciones y aprendizaje estadístico aplicado a redes inalámbricas

Author: Rattaro, Claudina and Belzarena, Pablo
Subjects: Aprendizaje estadístico, WiMax, Support vector machines, Control de admisión, QoS, IEEE 802.11e, Redes inalámbricas
Abstract: El presente documento contiene la documentación final de la Tesis de Maestría titulada: \Mediciones y Aprendizaje Estadístico aplicado a problemas de Redes Inalámbricas". La autora del mismo, Claudina Rattaro, es estudiante de la Maestría en Ingeniería Eléctrica de la Facultad de Ingeniería - UdelaR, Plan de Estudios 2004. El trabajo se llevó a cabo en el período comprendido entre agosto 2010 y setiembre 2012 bajo la tutoría del Doctor Pablo Belzarena. Desde hace unos años, las redes inalámbricas se han convertido en la tecnología más popular para brindar acceso a Internet. Como consecuencia de su fácil despliegue y bajos costos, estas juegan un papel fundamental a la hora de suministrar conectividad en entornos rurales aislados con baja densidad de población. En estas zonas es importante llegar con servicios de telemedicina y teleeducación, imprescindibles para lograr igualdad de oportunidades. Para desplegar este tipo de aplicaciones u otros servicios interactivos y audiovisuales, se necesita una infraestructura de red que garantice ciertos niveles de calidad de servicio. Las tecnologías más populares actualmente (ej.: IEEE 802.11) no pueden garantizar estrictos requisitos de calidad de servicio, por lo tanto, resulta necesaria la investigación de mecanismos adicionales. Este trabajo propone un enfoque de \caja negra" para estudiar el desempeño de las redes inalámbricas. En particular se presenta una metodología que permite la estimación de parámetros de calidad de servicio de extremo a extremo para una conexión en una red de este tipo. La técnica propuesta está basada en una combinación de mediciones activas en la red junto con la aplicación de técnicas de aprendizaje estadístico, donde el sistema es entrenado durante ciertos períodos de tiempo mediante ujos de aplicación y el envío de ráfagas de paquetes de medida. El análisis estadístico se basa en la utilización de la herramienta Support Vector Machines. Es importante destacar que el método propuesto resulta independiente de la tecnología inalámbrica utilizada. La metodología puede ser usada para varios propósitos. En este trabajo se presentan dos posibles aplicaciones: (i) estimación del throughput obtenido por cierta conexión en una red inalámbrica, (ii) elaboración de decisiones de control de admisión con el objetivo de garantizar requerimientos mínimos de calidad de servicio de extremo a extremo según cada aplicación. Se realizaron validaciones por medio de simulaciones y también de forma experimental en redes montadas en un laboratorio. Se incluyeron pruebas en redes heterogéneas: backbone WiMax y tramo de acceso WiFi. Se obtuvieron buenos resultados en la verificación de ambos casos de uso de la metodología. Se demuestra además que la técnica no resulta invasiva a pesar de que involucra mediciones activas en la red.
Published: 2012

43. Predicción de la estructura secundaria de proteínas usando Máquinas de soporte Vectorial

Author: Darío José Delgado, Henry Arguello Fuentes, and Rodrigo Gonzalo Torres
Subjects: lcsh:Biotechnology, lcsh:TP248.13-248.65, metodología de codificación, máquinas de soporte vectorial, prediction of protein secondary structure, coding methodology, predicción de la estructura secundaria de proteínas, support vector machines, TP248.13-248.65, Biotechnology
Abstract: Título en ingles: Protein secondary structure prediction using support vector machines Abstract : Among the computational methods used for predicting secondary structure proteins highlights the use of support vector machines. This research shows the predicted secondary structure of protein from its primary amino acid sequence using Support Vector Machines. As inputs, in the proposed methodology, features are used from different structural motifs or text strings associated with the primary structure which represents the secondary structure, such as R-group and the probability that the amino acid at position adopts a central particular secondary structure. For feature extraction method is used coding of sequences in which each symbol in the primary structure is associated with each symbol in the secondary structure. The use of this encoding method reduces the dimensionality of the data of thousands of characteristics only 220 of these. The results obtained are comparable to those reported in the literature, taking about 70% accuracy. Furthermore, it is possible to reduce computational cost in the construction of classifiers because this work models the problem of multi classification as a group of binary classifiers. Key words: coding methodology; support vector machines; prediction of protein secondary structure. Resumen: Entre los métodos computacionales utilizados para la predicción de la estructura secundaria de proteínas, se destaca el uso de máquinas de soporte vectorial. Este trabajo de investigación presenta la predicción de la estructura secundaria de proteínas desde su secuencia primaria de aminoácidos usando Máquinas de Soporte Vectorial. Como entradas, en la metodología propuesta, se utilizan características de los diferentes motivos estructurales o cadenas de texto asociadas a la estructura primaria que representa la estructura secundaria, tales como el R-grupo y la probabilidad de que el aminoácido en la posición central adopte una determinada estructura secundaria. Para la extracción de características se utiliza un método de codificación de secuencias en el que cada símbolo en la estructura primaria se relaciona con cada símbolo en la estructura secundaria. El uso de este método de codificación permite reducir la dimensionalidad de los datos de miles de características a sólo 220 de estas. Los resultados obtenidos son comparables a los registrados en la literatura, teniendo cerca de un 70% de precisión. Además, se logra reducir los costos computacionales en la construcción de los clasificadores debido a que este trabajo modela el problema de multi-clasificación como un grupo de clasificadores binarios. Palabras clave: máquinas de soporte vectorial; metodología de codificación; predicción de la estructura secundaria de proteínas.
Published: 2012

44. Hybrid approach for an optimal adjustement of a knowledge-based regression technique for locating faults in power distribution systems

Author: Correa Tapasco, Ever, Mora Flórez, Juan José, and Pérez-Londoño, Sandra Milena
Subjects: power distribution systems, regression, fault location, support vector machines, genetic algorithms
Abstract: This paper is focused in the development of a hybrid approach based on support vector machines (SVMs) which are used as a regression technique and also in the Chu-Beasley genetic algorithm (CBGA) which is used as an optimization technique to solve the problem of fault location. The proposed strategy consists of using the CBGA to adequately select the best configuration parameters of an SVM. As aresult of the application of this strategy, a well-suited tool is obtained to relate a set of inputs to a single output in a classical regression task,which is next used to determine the fault distance in power distribution systems, using single end measurements of voltage and current. Theproposed approach is initially tested in a simplified regression task using two functions in Â1 and Â2, where the results obtained are highlysatisfactory. Next, the selection of the adequate calibration parameters is performed in order to adjust the SVM using a cross validation strategy, where an average error of 5.75 % is obtained. These results show the adequate performance of the proposed methodology whichmerges SVM and CBGA into one powerful fault locator for application in power distribution systems.
Published: 2011

45. Pattern recognition using statistical techniques and neural networks: application to handwritten digit classification

Author: Seijas, Leticia María and Segura, Enrique Carlos
Subjects: AMBIGUOUS PATTERN, SUPPORT VECTOR MACHINES, CLASIFICACION DE DIGITOS MANUSCRITOS, ESTADISTICA BAYESIANA, BAYESIAN STATISTICS, RECONOCIMIENTO DE PATRONES, PATRONES AMBIGUOS, PATTERN RECOGNITION, HANDWRITTEN DIGIT CLASSIFICATION, MAQUINAS DE SOPORTE VECTORIAL, NEURAL NETWORKS, REDES NEURONALES
Abstract: El Reconocimiento de Patrones es el estudio de cómo las máquinas pueden observar el ambiente o entorno, aprender a distinguir patrones de interés a partir de la experiencia, y tomar decisiones razonables con respecto a las categorías a las que pertenecen dichos patrones. El mejor reconocedor de patrones conocido hasta ahora es el ser humano, no sabiéndose a ciencia cierta cuál es el proceso mediante el cual los humanos realizamos esta tarea. El Reconocimiento Optico de Caracteres (OCR) es uno de los tópicos más antiguos dentro del Reconocimiento de Patrones y una de las areas de investigación más importante y activa, que en la actualidad presenta desafío: la precisión en el reconocimiento asociada tanto a caracteres impresos en una imagen degradada o a caracteres manuscritos es aún insuficiente, existiendo errores en el reconocimiento. El Reconocimiento de Dígitos Manuscritos es un tema destacado dentro de OCR, por las aplicaciones relacionadas, como el procesamiento automático de cheques bancarios, la clasificación de correo en base a la lectura de códigos postales, la lectura automática de formularios y documentos con escritura manuscrita, dispositivos de lectura para ciegos, reconocimiento de escritura en computadoras manuales PDA, y porque constituye un problema modelo que incluye desafíos comunes con otros tópicos. Por esta razón, es tomado como referencia para la aplicación y testeo de nuevas teorías y algoritmos del area de Reconocimiento de Patrones en general. En este trabajo de tesis de doctorado se propone una nueva estrategia Bayesiana de combinación de clasificadores que permite detectar ambigüedades y resolverlas, lo que constituye la novedad y principal contribución de la tesis. Se propone, a su vez, un sistema completo de reconocimiento de patrones en dos niveles, con una arquitectura modular y paralelizable, que utiliza distintas características extraídas de los patrones de entrada según el problema a resolver junto con la estrategia Bayesiana ya mencionada que decide la respuesta del sistema. Como elementos componentes del reconocedor, en una primera capa o nivel, se utilizan clasificadores relativamente sencillos y bien posicionados para el problema a tratar. Los elementos pertenecientes a la segunda capa se utilizan para estimar cuán confiable es la respuesta de cada clasificador individual frente a un patrón de entrada, permitiendo decidir cuándo un patrón debe ser considerado bien definido o ambiguo, y en este ultimo caso con qué clases podrá confundirse. Adicionalmente, se proponen y aplican estrategias de selección de clasificadores en la etapa de construcción del reconocedor. El sistema reconocedor de patrones presentado fue aplicado al problema del reconocimiento de dígitos manuscritos off-line, como forma de testear su desempeño. En función de esto, se proponen descriptores basados en características de multirresolución a través del uso de la Transformada Wavelet CDF 9/7 y de Análisis de Componentes Principales, que permiten disminuir considerablemente el tamaño del patrón de entrada y aumentar la calidad de la representación. La experimentación se realizó sobre las bases de datos CENPARMI y MNIST, ampliamente referenciadas para este problema. Se obtuvieron altos porcentajes en el reconocimiento que alcanzaron un 97,40 y 99,32 % para las bases CENPARMI y MNIST respectivamente. Dichos valores son comparables a los resultados publicados considerados representativos. Pattern Recognition is the study of how machines can observe the environment, learn to distinguish patterns of interest from their background, and make sound and reasonable decisions about the categories of the patterns. The best pattern recognizers in most instances are humans, yet we do not understand how humans recognize patterns. Optical character recognition (OCR) is one of the most traditional topics in the context of Pattern Recognition that includes as a key issue the automatic recognition of handwritten characters. The subject has many interesting applications, such as automatic recognition of postal codes, recognition of amounts in banking checks and automatic processing of application forms. Handwritten numeral classification is a difficult task because of the wide variety of styles, strokes and orientations of digit samples. One of the main difficulties lies in the fact that the intra-class variance is high, due to the different forms associated with the same pattern, because of the particular writing style of each individual. Many models have been proposed to deal with this problem, but none of them has succeeded in obtaining levels of response comparable to human ones. This thesis presents a pattern recognition system that is able to detect ambiguous patterns and ex- plain its answers using a Bayesian strategy which is the main contribution of this work. The recogniser is composed of two levels. The first one is formed by a collection of independent classifiers, each one spe- cialised in a different feature extracted from the input pattern. The second level consists of an analyzing module in charge of defining and explaining the output of the system. This module is integrated by the following elements: the table of reliability and two parameters adjustable while running the system. The system has been applied to the off-line recognition of handwritten digits. Descriptors based on the CDF 9/7 wavelet transform and Principal Component Analysis are proposed in order to reduce the size of the input pattern while increasing the quality of its representation. Strategies for selecting classifiers for the system are also proposed. The experiments were carried out on the MNIST and CENPARMI handwritten digit databases, which are generally accepted as standards in most of the literature in the field. Recognition rates obtained are comparable with results from representative work, reaching 97.40 and 99.32 % for CENPARMI and MNIST databases respectively. Fil: Seijas, Leticia María. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Published: 2011

46. Estudio de un sistema de reconocimiento biométrico mediante firma manuscrita online basado en SVM usando Análisis Formal de Conceptos

Author: Mendaza Ormaza, Aitor, Miguel Hurtado, Óscar, Sanchez-Reillo, Raul, Valverde Albacete, Francisco José, and Peláez Moreno, Carmen
Subjects: Confusion matrices, Support vector machines, Biometría, SVM, Formal Concept Analysis, Electrónica, Online, Firma manuscrita
Abstract: 10 pages, 8 figures.-- Contributed to: V Jornadas de Reconocimiento Biométrico de Personas (JRBP 2010, Huesca, Spain, Sep 2-3, 2010). En el presente artículo se pretende estudiar las prestaciones de un sistema de reconocimiento biométrico mediante firma manuscrita usando la teoría de Análisis Formal de Conceptos (FCA). Se usará la modalidad online de la firma manuscrita, con un algoritmo basado en Máquinas de Vectores Soporte (SVM). Para analizar el desempeño del sistema se realizará un estudio de su matriz de confusión usando el Análisis de Conceptos Formales, y se procederá a extraer conclusiones sobre el sistema. Publicado
Published: 2010

47. PREDICCIÓN DE SERIES TEMPORALES USANDO MÁQUINAS DE VECTORES DE SOPORTE

Author: Velásquez, Juan D, Olaya, Yris, and Franco, Carlos J
Subjects: Time series, forecasting, máquinas de vectores de soporte, Series de tiempo, artificial neural networks, support vector machines, predicción, redes neuronales artificiales
Abstract: La predicción de series de tiempo es un importante problema de investigación debido a sus implicaciones en ingeniería, economía, finanzas y ciencias sociales. Un importante tópico de esta problemática es el desarrollo de nuevos modelos y su comparación con aproximaciones previas en términos de la precisión del pronóstico. Recientemente, las máquinas de vectores de soporte (SVM) han sido usadas para la predicción de series de tiempo, pero las experiencias reportadas son limitadas y hay algunos problemas relacionados con su especificación. El objetivo de este artículo es proponer una técnica novedosa para estimar algunas constantes en las SVM que usualmente son fijadas en forma empírica por el modelador. La técnica propuesta es usada para estimar varias SVM con el fin de pronosticar cinco series benchmark; los resultados obtenidos son comparados con las estadísticas reportadas en otros artículos. La metodología propuesta permite obtener SVM competitivas para las series pronosticadas en comparación con los resultados obtenidos usando otros modelos más tradicionales. Time series prediction is an important research problem due to its implications in engineering, economics, finance and social sciences. An important topic about this problematic is the development of new models and its comparison with previous approaches in terms of forecast accuracy. Recently, support vector machines (SVM) have been used for time series prediction, but the reported experiences are limited and there are some problems related to its specification. The aim of this paper is to propose a novel technique for estimating some constants of the SVM usually fixed empirically by the modeler. The proposed technique is used to estimate several SVM with the aim of forecast five benchmark time series; the obtained results are compared with the statistics reported in other papers. The proposed method allow us to obtain competitive SVM for the time series forecasted in comparison with the results obtained using other most traditional models.
Published: 2010

48. Hybrid classification model based on genetic algorithms and support vector machines applied to credit evaluation

Author: Ramírez Aya, Andrés Yesid and León Guzmán, Elizabeth
Subjects: Máquinas de vectores de soporte, Support vector machines, Selección de características, Evaluación crediticia, 62 Ingeniería y operaciones afines / Engineering, Clasificación / Credit evaluation, Feature selection, Genetic algorithms, Algoritmos genéticos, Classification
Abstract: Este proyecto presenta un modelo híbrido de clasificación para el problema de la evaluación crediticia, tomando ventaja de la selección de características. En primera instancia, se presenta una breve revisión de las distintas técnicas computacionales aplicadas en la evaluación crediticia y en la selección de características. Después de esto, un modelo híbrido de clasificación, basado en Algoritmos Genéticos y Máquinas de Vectores de Soporte es construido, donde la principal idea es seleccionar las características más importantes que impactan el desempeño en la clasificación. Este modelo es aplicado a un problema bien conocido: La evaluación crediticia en donde muchos experimentos se llevan a cabo con diferentes conjuntos de datos. Finalmente, el modelo propuesto es comparado con otras técnicas de clasificación y predicción como las Máquinas de Vectores de Soporte (SVM) y las Redes Neuronales Artificiales (ANN) los cuales utilizan todos los atributos de los conjuntos de datos. Esto es ejecutado con el objetivo de probar la competitividad del modelo híbrido propuesto. / Abstract: This project presents a hybrid classification model for the credit evaluation problem taking advantage on feature selection. In first instance, a short review of different computational techniques for credit evaluation and feature selection is presented. After that, a hybrid classification model based on Genetic Algorithm and Support Vector Machines is built where the main idea is to select the most important features that impact the classification performance. This model is applied to a well-known problem: the credit evaluation where many experiments are carried out with different credit data sets. Finally, the proposed model is compared with other classification and prediction techniques like Support Vector Machines (SVM) and Artificial Neural Networks (ANN) which use all data set attributes. This is achieved in order to test the competitiveness of the proposed hybrid model. Maestría
Published: 2010

49. Metodologías cooperativas para la clasificación del tránsito

Author: Rodriguez Teja, Federico and Grampin Castro, Eduardo
Subjects: Machine Learning, Network Trac Classication, Support Vector Machines, Quality of Servic, Naïves Bayes
Published: 2009

50. Implementación mediante FPGA de un sistema SVM de verificación de locutor

Author: Ramos Lara, Rafael Ramón, López García, Mariano, Canto Navarro, Enrique Fernando, Puente Rodriguez, Luis, Universitat Politècnica de Catalunya. Departament d'Enginyeria Electrònica, Universitat Politècnica de Catalunya. Centre de Desenvolupament Tecnològic de Sistemes d'Adquisició Remota i Tractament de la Informació (SARTI), and Universitat Politècnica de Catalunya. SARTI - Centre de Desenvolupament Tecnològic de Sistemes d'Adquisició Remota i Tractament de la Informació
Subjects: Support vector machines, Dispositius lògics programables, Field programmable gate arrays, Enginyeria electrònica::Microelectrònica::Sistemes digitals programables [Àrees temàtiques de la UPC], Sistemes experts (Informàtica)
Abstract: Los sistemas biométricos caracterizados por su alto nivel de seguridad se implementan habitualmente con sistemas procesadores de altas prestaciones como los ordenadores personales. Estos procesadores trabajan en un rango de frecuencias de GHz que les permiten realizar millones de operaciones por segundo, de forma que pueden ejecutar en tiempo real complejos algoritmos de verificación. Sin embargo, esta solución de implementación tiene el inconveniente del elevado coste. La utilización de dispositivos programables del tipo FPGA (Field Programmable Gate Array) permite obtener a bajo coste soluciones a medida con las que se consiguen elevadas velocidades de proceso similares a los sistemas μP de altas prestaciones. En este artículo se presenta el diseño e implementación sobre una FPGA de un sistema de verificación de locutor basado en los coeficientes Mel-Cepstrum y en un algoritmo de clasificación SVM (Support Vector Machines). Los resultados experimentales obtenidos con el diseño propuesto muestran una velocidad de proceso equiparable a la conseguida con un ordenador personal basado en el μP Pentium IV.
Published: 2009

Catalog

Books, media, physical & digital resources

See catalog results

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Search

Search Constraints

Refine your results

Search Limiters

Topic

Publication Year Range

Journal

Database

Publisher

53 results on '"SUPPORT vector machines"'

Search Results

Catalog

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources