Back to Search Start Over

Clasificación de la señal de audio cardíaco mediante análisis tiempo-frecuencia y aprendizaje de máquinas

Authors :
Leonel Orozco Reyes
MIGUEL ANGEL ALONSO AREVALO
Source :
Centro de Investigación Científica y de Educación Superior de Ensenada, CICESE, Repositorio Institucional CICESE
Publication Year :
2022
Publisher :
CICESE, 2022.

Abstract

La auscultación es una herramienta de diagnóstico no invasiva, de bajo costo y de sencilla implementación, que actualmente provee información importante en el diagnóstico de patologías cardíacas. Con ayuda de la auscultación se obtiene el sonido cardíaco o fonocardiograma, que es el elemento principal del análisis de este trabajo. Los errores de diagnóstico debido a la falta de médicos experimentados y las limitaciones del sistema auditivo humano han llevado al avance en el área de procesamiento digital de señales y el desarrollo de técnicas para el análisis de sonidos cardíacos asistidos por computadora. El presente trabajo tiene como objetivo principal la aplicación del análisis de técnicas de aprendizaje de máquinas para la clasificación de audio cardíaco. Haciendo uso de tres representaciones tiempo-frecuencia siendo estas el espectrograma, el espectrograma en escala de Mel y la transformada ondeleta Synchrosqueezing, para generar matrices de características que mejor representen la señal de audio cardíaco. Las matrices obtenidas serán clasificadas usando redes neuronales convolucionales, en este trabajo se usarán tres arquitecturas de redes neuronales que han demostrado tener un desempeño notable en tareas de clasificación. Los resultados obtenidos indican que la correcta variación de la combinación de las tres representaciones tiempo-frecuencia, así como la correcta elección del clasificador influye en el rendimiento y el tiempo necesario para la clasificación. Auscultation is a non-invasive, low-cost, easy-to-implement diagnostic tool that provides valuable information for diagnosing cardiac pathologies. With the help of a digital stethoscope, a heart sound or phonocardiogram signal is obtained, which is the main element of study in this dissertation. Misdiagnosis due to a lack of experienced clinicians and the human auditory system’s limitations have led to modern computer-aided analysis of heart sounds. The present work has the main objective of applying audio signal processing and machine learning techniques to classify heart sounds as normal or abnormal. The proposed methodology uses three time-frequency representations, the spectrogram, the mel scale spectrogram, and the wavelet synchrosqueezed transform. We generate a feature matrix that best represents the heart sound based on these representations. The obtained matrices are classified using convolutional neural networks; three neural networks architectures are used AlexNet, VGG16, and Ullah. These architectures have shown a remarkable performance in classification tasks. The obtained results indicate that the proper combination of the three time-frequency representations and the appropriate choice of the classifier have a significant repercussion on the performance and the time required for classification.

Details

Language :
Spanish; Castilian
Database :
OpenAIRE
Journal :
Centro de Investigación Científica y de Educación Superior de Ensenada, CICESE, Repositorio Institucional CICESE
Accession number :
edsair.od......3056..14685f0bfefe847c4c697fc50f981a41