106 results on '"Guido, Rodrigo Capobianco"'
Search Results
102. Identification of voice spoofing in speaker verification systems using enhanced Teager power operator and paraconsistent feature engineering
- Author
-
Pedroso, Fernando [UNESP], Universidade Estadual Paulista (Unesp), and Guido, Rodrigo Capobianco [UNESP]
- Subjects
Voice spoofing ,Signal processing ,Intelligent systems ,Processamento de sinais ,Sistemas inteligentes - Abstract
Submitted by Fernando Pedroso (fernando.pedroso2@etec.sp.gov.br) on 2021-10-18T20:21:56Z No. of bitstreams: 1 Dissertação Fernando Pedroso - Defesa 02-09-2021.pdf: 3160905 bytes, checksum: e0e4673fe42957810de60a8184f6a3be (MD5) Rejected by Elza Mitiko Sato null (elzasato@ibilce.unesp.br), reason: Solicitamos que realize correções na submissão seguindo as orientações abaixo: 01 – No rodapé da FOLHA DE ROSTO colocar (sem o ,SP): São José do Rio Preto 2021 02 - Informamos que é imprescindível que coloque a FICHA CATALOGRÁFICA, gerada pelo sistema (ficha + informações abaixo dela). Você poderá elaborar a sua ficha acessando o Sistema Gerador de Fichas Catalográficas online. https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/ficha-catalografica/ 03 – Na FOLHA DE APROVAÇÃO não é necessário colocar orientador abaixo da natureza da pesquisa. 04 – A data efetiva da defesa deve ser colocada no rodapé da FOLHA DE APROVAÇÃO: São José do Rio Preto 2 de setembro de 2021 05 – Solicitamos corrigir as Palavras-chave/keywords: iniciando com letras maiúsculas e separadas por ponto. 06 - A paginação deve ser sequencial, iniciando a contagem na FOLHA DE ROSTO e mostrando o número a partir da introdução, a FICHA CATALOGRÁFICA ficará após a folha de rosto, será contada caso o trabalho seja formatado em página, se for formatado como folhas não deverá ser contada, e na ficha catalográfica o número de folhas deve ser igual ao número da última folha do trabalho, para a numeração das páginas devem seguir um padrão. O correto ABNT 14724 no canto superior direito da folha. 07 - Caso você formate em páginas observar a margem, as margens devem ser: para o anverso, esquerda e superior de 3 cm e direita e inferior de 2 cm; para o verso, direita e superior de 3 cm e esquerda e inferior de 2 cm. Agora caso a impressão seja em folhas apenas selecione (f) ou página (p) na ficha. 08 – No Sumário falta colocar a indicação das Referências, o correto é REFERÊNCIAS e não REFERÊNCIAS BIBLIOGRÁFICAS e também a indicação dos Apêndices. 09 - Segundo a norma ABNT NBR 14724, os APÊNDICES são elementos pós-textuais e devem ser inseridos após as Referências e identificados por LETRA maiúscula(a letras após o nome da seção), sendo necessário também escrever o título. Ex: 5 Conclusões 44 Referências .................47 Apêndice A – Título .... 50 Apêndice B – Título .... 56 10 - Ilustrações e tabelas: a norma orienta que devem ter a descrição da fonte abaixo delas, mesmo que seja produção do autor (ABNT NBR 14724). 11 – Sugerimos não colocar CAPÍTULO no título no início das seções. Será que o seu arquivo desconfigurou? Os títulos das seções estão demasiadamente grandes. 12 - Todos os artigos, com a menção do periódico, que estejam no documento tem que ser verificados no banco de dados Sherpa Romeo. Então quanto aos artigos orientamos: Fonte consultada: Sherpa Romeo (compila as políticas de acesso aberto (OA) de periódicos) Artigo 1: International Journal of Wavelets, Multiresolution and Information Processing https://v2.sherpa.ac.uk/id/publication/9712 Para a disponibilização da versão publicada do artigo no Repositório é necessário ter pago uma taxa. Se isso se confirmar pode manter essa versão. Caso não tenha havido pagamento, é necessário trocar para a versão aceita, com as condições marcadas em vermelho. O prazo de embargo já encerrou, mas é importante descrever o DOI. Para ambos os casos, oriento inserir a referência completa do artigo. Pode ser abaixo da menção a ele no apêndice. (Inserir a data de acesso). GUIDO, R. C.; PEDROSO, F.; FURLAN, A.; CONTRERAS, R. C.; CAOBIANCO, L. G.; SUDA NETO, J. CWT x DWT x DTWT x SDTWT: clarifying terminologies and rolesof different types of wavelet transforms. International Journal of Wavelets, Multiresolution and Information Processing, Singapore, v. 18, n. 6 (2020), p. 2030001/1-5, Jul. 2020. DOI: https://doi.org/10.1142/S0219691320300017. Disponível em: https://www.worldscientific.com/doi/10.1142/S0219691320300017. Acesso em: dia mês ano. __________________________________________ Artigo 2: Digital Signal Processing https://v2.sherpa.ac.uk/id/publication/11283 Da mesma maneira, para a disponibilização da versão publicada do artigo no Repositório é necessário ter pago uma taxa. Se isso se confirmar pode manter essa versão. Parece-me que o artigo não tem a licença Creative Commons CC BY destacada. Poderia inserir a descrição dela, segundo a orientação do site. Senão, será necessário trocar para a versão aceita, com as condições marcadas em vermelho. Prazo de embargo de 24 meses no Repositório; inserir a licença Creative Commons CC BY-NC-ND. É importante descrever o DOI. Para ambos os casos, oriento inserir a referência completa do artigo. Pode ser abaixo da menção a ele no apêndice. (Inserir a data de acesso). GUIDO, R. C.; PEDROSO, F.; CONTRERAS, R. C.; RODRIGUES, L. C.; GUARIGLIA, E.; SUDA NETO, J. Introducing the Discrete Path Transform (DPT) and its applications in signal analysis, artefact removal, and spoken word recognition. Digital Signal Processing, Waltham, v. 117, p. 103158 (1-14), Oct. 2021. DOI: https://doi.org/10.1016/j.dsp.2021.103158. Disponível em: https://www.sciencedirect.com/science/article/pii/S1051200421001974. Acesso em: dia mês ano. Sugerimos que siga as orientações do template para as correções, na página da Biblioteca, link: https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/estrutura-do-trabalho-academico/ Lembramos que o arquivo depositado no Repositório deve ser igual ao impresso, o rigor com o padrão da Universidade se deve ao fato de que o seu trabalho passará a ser visível mundialmente. Agradecemos a compreensão. on 2021-10-23T23:48:18Z (GMT) Submitted by Fernando Pedroso (fernando.pedroso2@etec.sp.gov.br) on 2022-03-08T01:53:16Z No. of bitstreams: 1 Dissertação Fernando Pedroso - Defesa 02-09-2021.pdf: 3353481 bytes, checksum: e3ee521aec6d1f67ac333ef3d947e7a2 (MD5) Approved for entry into archive by Vivian Letícia Duarte Parisi (vivian.parisi@unesp.br) on 2022-03-08T15:05:35Z (GMT) No. of bitstreams: 1 pedroso_f_me_sjrp.pdf: 3353481 bytes, checksum: e3ee521aec6d1f67ac333ef3d947e7a2 (MD5) Made available in DSpace on 2022-03-08T15:05:35Z (GMT). No. of bitstreams: 1 pedroso_f_me_sjrp.pdf: 3353481 bytes, checksum: e3ee521aec6d1f67ac333ef3d947e7a2 (MD5) Previous issue date: 2021-09-02 Os avanços tecnológicos têm possibilitado cada vez mais a busca e a disseminação de informações e, com isso, o volume de dados gerados cresce extraordinariamente. Outro fator que contribui para este crescimento é o uso de dispositivos de Internet das Coisas (IoT), como Google Home e Amazon Alexa, e de outros assistentes de voz para permitir o gerenciamento de várias operações remotas em residências e escritórios. Assim, faz-se necessário o uso de sistemas para garantir o acesso e a segurança desses dados. Diante das pesquisas apresentadas, percebe-se a necessidade de maiores estudos no sentido de ampliar a eficiência dos sistemas de detecção dos ataques de reprodução eletrônica de voz (AREV), em especial os replay attacks, nos sistemas de autenticação biométrica por voz. Grande parte dos trabalhos correntes utiliza as mesmas técnicas e recursos para minimizar as possibilidades de fraudes. Particularmente, o estado-da-arte contempla vetores de características (VCs) baseados em análise espectral direta, coeficientes Q-cepstrais, filtragem digital, cepstrum, energias instantâneas e derivados, contando com classificadores dos tipos Support Vector Machines (SVMs), Gaussian Mixture Models (GMMs) e Deep Neural Networks (DNNs), avaliados nas bases ASVspoof 2015, ASVspoof 2017, ASVspoof 2019, RedDots, BTAS 2016 e, ainda, TIMIT. Diferentemente, neste trabalho experimentam-se VCs baseados no conceito de planaridade espectral e no Operador de Energia de Teager Aprimorado (OETA), obtidos artesanalmente, os quais são avaliados com base na Engenharia Paraconsistente de Características (EPC), considerando-se 21600 sinais da base ASVspoof 2019. Os resultados apresentados implicam a viabilidade da utilização da EPC para análise e seleção dos melhores VCs, independentemente de qualquer classificador, podendo-se observar ainda, nas características ótimas, a viabilidade do OETA em relação àquelas que não se baseiam nele. Os classificadores utilizados nos testes foram baseados em distâncias Euclidianas e SVMs de núcleos Gaussianos, produzindo uma equal error rate (EER) de 0.147 e uma acurácia superior a 90%. Technological advances have increasingly made it possible to search for and disseminate information and, as a result, the volume of data generated grows extraordinarily. Another factor contributing to this growth is the use of Internet of Things (IoT) devices, such as Google Home and Amazon Alexa, and other voice assistants to enable the management of various remote operations in homes and offices. Thus, it is necessary to use systems to ensure access and security of these data. In view of the research presented, there is a clear need for further studies in order to increase the efficiency of electronic voice reproduction (AREV) attack detection systems, especially replay attacks, in biometric voice authentication systems. Much of the current work uses the same techniques and resources to minimize the possibility of fraud. Particularly, the state-of-the-art includes feature vectors (VCs) based on direct spectral analysis, Q-cepstral coefficients, digital filtering, cepstrum, instantaneous energies and derivatives, counting on Support Vector Machines (SVMs), Gaussian Mixture classifiers Models (GMMs) and Deep Neural Networks (DNNs), evaluated on the basis of ASVspoof 2015, ASVspoof 2017, ASVspoof 2019, RedDots, BTAS 2016 and also TIMIT. Differently, in this work, VCs are tested based on the concept of spectral planarity and on the Enhanced Teager Power Operator (OETA), obtained by hand, which are evaluated based on the Paraconsistent Characteristics Engineering (EPC), considering 21600 signals from the base ASVspoof 2019. The results presented imply the feasibility of using EPC for the analysis and selection of the best VCs, regardless of any classifier, and it is also possible to observe, in the optimal characteristics, the feasibility of the OETA in relation to those that are not based on it. The classifiers used in the tests were based on Euclidean distances and SVMs of Gaussian cores, producing an equal error rate (EER) of 0.147 and an accuracy greater than 90%.
- Published
- 2021
103. Voice spoofing characterization for speaker verification purposes based on wavelet transform and paraconsistent feature analysis
- Author
-
Furlan, André, Universidade Estadual Paulista (Unesp), and Guido, Rodrigo Capobianco [UNESP]
- Subjects
Voice spoofing ,Análise paraconsistente ,Paraconsistent analysis ,Wavelets ,Playback speech - Abstract
Submitted by André Furlan (andre.furlan@unesp.br) on 2021-09-13T04:11:07Z No. of bitstreams: 1 monografia.pdf: 3274652 bytes, checksum: ec8019ff69dcfb4f3403678fa86ee2dd (MD5) Rejected by Elza Mitiko Sato null (elzasato@ibilce.unesp.br), reason: Solicitamos que realize correções na submissão seguindo as orientações abaixo: 01 - Solicitamos corrigir a formatação da CAPA conforme o template. Sugerimos que siga as orientações do template para as correções, na página da Biblioteca, link: https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/estrutura-do-trabalho-academico/ Não é necessário colocar Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista ”Júlio de Mesquita Filho”, Campus de São José do Rio Preto na CAPA. 02 – No rodapé da CAPA E FOLHA DE ROSTO colocar (sem o –SP): São José do Rio Preto 2021 03 – Na FOLHA DE ROSTO não é necessário colocar Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista ”Júlio de Mesquita Filho”, Campus de São José do Rio Preto, pois já consta na Natureza da Pesquisa. 04 – Solicitamos que você corrija a formatação da FOLHA DE APROVAÇÃO conforme o template: nome por extenso, titulação dos componentes da banca examinadora e instituições a que pertencem, e devem constar apenas os membros titulares. Ex: Comissão examinadora Prof. Dr. Rodrigo Capobianco Guido UNESP – Câmpus de São José do Rio Preto Orientador Prof. Dr. Aleardo Manacero Jr UNESP – Câmpus de São José do Rio Preto Prof. Dr. Henrique Dezani FATEC – São José do Rio Preto Obs: Não há necessidade de colocar “Trabalho: Aprovado” 05 – No rodapé da FOLHA DE APROVAÇÃO colocar : São José do Rio Preto 25 de agosto de 2021 06 - Segundo a norma ABNT NBR 10520, a epígrafe é uma citação e deve ser referenciada. 07 - Resumos: a correta grafia é Keywords, iniciar cada palavra-chave (português e inglês) com maiúscula e separa-las com ponto. 08 - Observamos que na ficha catalográfica você selecionou a formatação em páginas? Caso seja em páginas observar a margem, as margens devem ser: para o anverso, esquerda e superior de 3 cm e direita e inferior de 2 cm; para o verso, direita e superior de 3 cm e esquerda e inferior de 2 cm. Agora caso a impressão seja em folhas apenas corrija na ficha (f). 09 – No seu trabalho as indicações da figuras na Lista de ilustrações e também o Sumário estão escritos na cor azul, é realmente necessário que seja destacado ? Pois conforme a ABNT 14724: 5 Regras gerais A apresentação de trabalhos acadêmicos deve ser elaborada conforme 5.1 a 5.9. 5.1 Formato Os textos devem ser digitados ou datilografados em cor preta, podendo utilizar outras cores somente para as ilustrações. 10 - Ilustrações e tabelas: a norma orienta que devem ter a descrição da fonte abaixo delas, mesmo que seja produção do autor. (ABNT NBR 14724). 11 – Falta colocar o título na figura 6 da folha 51. Sugerimos que siga as orientações do template para as correções, na página da Biblioteca, link: https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/estrutura-do-trabalho-academico/ Lembramos que o arquivo depositado no Repositório deve ser igual ao impresso, o rigor com o padrão da Universidade se deve ao fato de que o seu trabalho passará a ser visível mundialmente. Agradecemos a compreensão. on 2021-09-13T20:46:20Z (GMT) Submitted by André Furlan (andre.furlan@unesp.br) on 2021-09-15T15:54:35Z No. of bitstreams: 1 monografia.pdf: 3269943 bytes, checksum: 5f89679ca1d82152239be803a0e88484 (MD5) Approved for entry into archive by Elza Mitiko Sato null (elzasato@ibilce.unesp.br) on 2021-09-16T12:47:23Z (GMT) No. of bitstreams: 1 furlan_a_me_sjrp.pdf: 3269943 bytes, checksum: 5f89679ca1d82152239be803a0e88484 (MD5) Made available in DSpace on 2021-09-16T12:47:23Z (GMT). No. of bitstreams: 1 furlan_a_me_sjrp.pdf: 3269943 bytes, checksum: 5f89679ca1d82152239be803a0e88484 (MD5) Previous issue date: 2021-08-25 Voice spoofing é uma estratégia genérica utilizada para burlar sistemas de autenticação biométrica baseados em identificação por voz. Dentre as diversas possibilidades específicas, os ataques do tipo playback speech são os que têm recebido considerável atenção da comunidade científica. Assim, por meio da decomposição dos sinais de voz com wavelets e posterior análise das respectivas sub-bandas espectrais BARK e MEL, este trabalho dedica-se a determinar qual a melhor combinação BARK/MEL-wavelet para que se obtenha uma separação máxima entre duas classes: Locuções genuínas e falseadas. Após a apuração da melhor combinação de descritores, realizada por meio da Análise Paraconsistente, os vetores de características oriundos dos sinais de voz são submetidos a ensaios de classificação, variando-se o tamanho do conjunto de treinamento e testes. Utilizando as distâncias Euclidiana e Manhattan, além de Máquinas de Vetores de Suporte (SVM), a acurácia máxima obtida foi de 99,7561% para uma base com 820 sinais, a qual considera-se como um resultado promissor frente àqueles existentes na literatura. Voice spoofing is a generic strategy designed to circumvent biometric systems based on voice identification. Among a diversity of specific possibilities, playback speech attacks have received considerable attention from the scientific community. Thus, based on speech signals decomposition with wavelets for subsequent BARK and MEL scales spectral analysis, this dissertation aims at determining the best filters and scales to optimally separate between two classes: Genuine and spoofed speech. Once the best combination of descriptors is obtained, based on Paraconsistent Engineering, the feature vectors are subjected to classification, varying the randomly chosen training and test sets in size. Euclidean and Manhattan distances, as well as Support Vector Machine (SVM), were used as classifiers, where the highest value of accuracy was 99.7561% for a dataset with 820 signals. This is a promising result, considering the state-of-the-art in the field.
- Published
- 2021
104. Intelligent classification of musical signals using a Wavelet Packet transform
- Author
-
Scalvenzi, Rafael Rubiati, Universidade Estadual Paulista (Unesp), Marranguello, Norian [UNESP], and Guido, Rodrigo Capobianco [UNESP]
- Subjects
Transformada wavelet-packet ,Redes neurais artificiais ,Processamento de sinais digitais ,Wavelet-packet transform ,Artificial neural networks ,Musical signals ,Autocorrelation ,Sinais musicais ,Autocorrelação ,Digital signal processing - Abstract
Submitted by RAFAEL RUBIATI SCALVENZI (rafaelrubiati@yahoo.com) on 2018-08-23T14:58:47Z No. of bitstreams: 1 Dissertacao Rafael Rubiati.pdf: 3684917 bytes, checksum: 933c9cd1b163eaf62189c9f2bcfcdd2f (MD5) Approved for entry into archive by Elza Mitiko Sato null (elzasato@ibilce.unesp.br) on 2018-08-23T19:34:48Z (GMT) No. of bitstreams: 1 scalvenzi_rr_me_sjrp_.pdf: 3684917 bytes, checksum: 933c9cd1b163eaf62189c9f2bcfcdd2f (MD5) Made available in DSpace on 2018-08-23T19:34:48Z (GMT). No. of bitstreams: 1 scalvenzi_rr_me_sjrp_.pdf: 3684917 bytes, checksum: 933c9cd1b163eaf62189c9f2bcfcdd2f (MD5) Previous issue date: 2018-07-20 A área na qual a música está inserida requer, para sua compreensão, considerável abstração. Neste âmbito, a análise matemático-computacional possui papel importante, principalmente para planejar a interatividade entre aluno e computador, potencializando o aprendizado musical. Embora um número considerável de estudos em diferentes contextos sejam dedicados à classificação das estruturas sonoras, os procedimentos de análise em um grande conjunto de sinais podem tornar-se uma tarefa difícil e exaustiva. Diante do exposto, este trabalho tem como objetivo a proposição e a implementação de um método capaz de reconhecer e classificar sinais musicais em tempo real, visando auxiliar os aprendizes. No método proposto, um conjunto relevante de eventos musicais é inspecionado por meio da análise de multirresolução baseada na Transformada Wavelet-Packet, escolhida em função da característica multidimensional encontrada na música, a qual permite isolar diferentes eventos musicais em níveis de decomposição wavelet distintos. Apoiado por um processo de autocorrelação e uma rede neural artificial, cada padrão sônico é associado ao seu respectivo evento musical. Testes envolvendo centenas de sinais permitiram obter uma acurácia quase plena com um tempo relativamente bastante pequeno de análise em função da baixa ordem de complexidade computacional do algoritmo implementado, reafirmando a sua aplicabilidade Music belongs to an area which requires a considerable piece of abstraction for its understanding. In this domain, computational and mathematical analyses play an important role, particularly for planning human-machine interaction and enhancing learning. Although a considerable number of studies in different musical contexts are dedicated to the classification of the structures present in sound signals, the inspection of long clips is a challenge. Thus, this work proposes and implements a method capable of identifying and classifying musical signals in real-time, helping music students. Specifically, multiresolution analysis using the Wavelet-Packet Transform is adopted, allowing for different musical events to be isolated in distinct wavelet levels of decomposition. Based on an autocorrelation and an artificial neural network, each sonic pattern is associated with a respective musical event. Tests using hundreds of music clips exhibit almost full accuracy with relatively very short time consumption as a function of the algorithm low level of computational complexity, reassuring its applicability.
- Published
- 2018
105. Fault detection in eletric motor through Wavelet packet transform and dimensionality reduction methods
- Author
-
Marcus Vinicius Monteiro Varanis, Pederiva, Robson, 1957, Cavalca, Katia Lucchesi, Mastelari, Niederauer, Guido, Rodrigo Capobianco, Baccarini, Lane Maria Rabelo, Universidade Estadual de Campinas. Faculdade de Engenharia Mecânica, Programa de Pós-Graduação em Engenharia Mecânica, and UNIVERSIDADE ESTADUAL DE CAMPINAS
- Subjects
Wavelet (Mathematical) ,Motores elétricos ,Eletrical Motors ,Vibrations ,Análise de componentes principais ,Principal components analysis ,Linear discriminat analysis ,Vibração ,Wavelets (Matemática) - Abstract
Orientador: Robson Pederiva Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Mecânica Resumo: Motores elétricos são componentes de grande importância na maioria dos equipamentos de plantas industriais. As diversas falhas que ocorrem nas máquinas de indução podem gerar consequências severas no processo industrial. Os principais problemas estão relacionados à elevação dos custos de produção, piora nas condições do processo e de segurança e, sobretudo piora na qualidade do produto final. Muitas destas falhas mostram-se progressivas. Neste trabalho, apresenta-se uma contribuição ao estudo de Técnicas de Processamento de Sinais Baseadas na Transformada Wavelet para extração de parâmetros de Energia e Entropia a partir de sinais de vibração para detecção de falhas no regime não-estacionário (parada e partida do motor). Em conjunto com a transformada Wavelet utilizam-se métodos de redução de dimensionalidade como, a análise em componentes principais (PCA e a análise Linear Discriminante (LDA). O uso de uma bancada experimental mostra que os resultados da classificação têm alta precisão Abstract: Electric motors are very important components in most industrial plants equipment. The several faults occurring in induction machines can generate severe consequences in the industrial process. The main problems are related to high production costs, worsening the conditions of process and security, and especially poor quality of the final product. Many of these failures are shown progressive. This work presents a contribution to the study of Signal Processing Techniques Based on Wavelet Packet Transform for extracting parameters of Energy and Entropy, together makes the use of dimensionality reduction methods like the Principal components Analysis (PCA) and Linear Dscriminant Analysis (LDA). This analysis is done from the acquisition of vibration signals in Non-Stationary state (stop and start the engine). The results show that the performance of classification has high accuracy based on experimental work Doutorado Mecânica dos Sólidos e Projeto Mecânico Doutor em Engenharia Mecânica
- Published
- 2014
106. Compression of electrocardiograms using wavelets
- Author
-
Cristiano Marcos Agulhari, Bonatti, Ivanil Sebastião, 1951, Guido, Rodrigo Capobianco, Peres, Pedro Luis Dias, Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação, Programa de Pós-Graduação em Engenharia Elétrica, and UNIVERSIDADE ESTADUAL DE CAMPINAS
- Subjects
Data compression ,Compressão de dados (Computação) ,Eletrocardiografia ,Electrocardiograms ,Wavelet ,Wavelets (Matemática) - Abstract
Orientador: Ivanil Sebastião Bonatti Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação Resumo: A principal contribuição desta dissertação é a proposta de dois métodos de compressão de eletrocardiogramas (ECGs). O primeiro método, chamado Run Length Encoding Adaptativo (RLEA), é baseado nas transformadas wavelet e consiste basicamente em utilizar uma função wavelet, obtida pela resolução de um problema de otimização, que se ajuste ao sinal a ser comprimido. O problema de otimização torna-se irrestrito com a parametrização dos coeficientes do filtro escala, que definem unicamente uma função wavelet. Após a resolução do problema de otimização é aplicado o procedimento de decomposição wavelet no sinal e os coeficientes de representação mais significativos são retidos, sendo que o número de coeficientes retidos é determinado de forma a satisfazer uma medida de distorção pré-especificada. Os coeficientes retidos são então quantizados e compactados, assim como o bitmap que indica as posições dos coeficientes retidos. A quantização é feita de forma adaptativa, utilizando diferentes números de bits de quantização para os diferentes subespaços de decomposição considerados. Tanto os valores dos coeficientes retidos quanto o bitmap são codificados utilizando uma variante do método Run Length Encoding. O segundo método proposto nesta dissertação, chamado Zero Padding Singular Values Decomposition (ZPSVD), consiste em primeiramente detectar os batimentos, equalizá-los pela inserção de zeros (zero padding) e então aplicar a decomposição SVD para obter tanto a base quanto os coeficientes de representação dos batimentos. Alguns componentes da base são retidos e então comprimidos utilizando os mesmos procedimentos aplicados aos coeficientes de decomposição do ECG no método RLEA, enquanto que os coeficientes de projeção dos batimentos nessa base são quantizados utilizando um procedimento de quantização adaptativa. Os dois métodos de compressão propostos são comparados com diversos outros métodos existentes na literatura por meio de experimentos numéricos Abstract: The main contribution of the present thesis is the proposition of two electrocardiogram (ECG) compression methods. The first method, called Run Length Encoding Adaptativo (RLEA), is based on wavelet transforms and consists of using a wavelet function, obtained by the resolution of an optimization problem, which fits to the signal to be compressed. The optimization problem becomes unconstrained with the parametrization of the coefficients of the scaling filter, that define uniquely a wavelet function. After the resolution of the optimization problem, the wavelet decomposition procedure is applied to the signal and the most significant coefficients of representation are retained, being the number of retained coefficients determined in order to satisfty a pre-specified distortion measure. The retained coefficients are quantized and compressed, likewise the bitmap that informs the positions of the retained coefficients. The quantization is performed in an adaptive way, using different numbers of bits for the different decomposition subspaces considered. Both the values of the retained coefficients and the bitmap are encoded using a modi- fied version of the Run Length Encoding technique. The second method proposed in this dissertation, called Zero Padding Singular Values Decomposition (ZPSVD), consists of detecting the beat pulses of the ECG, equalizing the pulses by inserting zeros (zero padding), and finally applying the SVD to obtain both the basis and the coefficients of representation of the beat pulses. Some components of the basis are retained and then compressed using the same procedures applied to the coefficients of decomposition of the ECG in the RLEA method, while the coefficients of projection of the beat pulses in the basis are quantized using an adaptive quantization procedure. Both proposed compression methods are compared to other techniques by means of numerical experiments Mestrado Telecomunicações e Telemática Mestre em Engenharia Elétrica
- Published
- 2009
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.