Submitted by Fernando Pedroso (fernando.pedroso2@etec.sp.gov.br) on 2021-10-18T20:21:56Z No. of bitstreams: 1 Dissertação Fernando Pedroso - Defesa 02-09-2021.pdf: 3160905 bytes, checksum: e0e4673fe42957810de60a8184f6a3be (MD5) Rejected by Elza Mitiko Sato null (elzasato@ibilce.unesp.br), reason: Solicitamos que realize correções na submissão seguindo as orientações abaixo: 01 – No rodapé da FOLHA DE ROSTO colocar (sem o ,SP): São José do Rio Preto 2021 02 - Informamos que é imprescindível que coloque a FICHA CATALOGRÁFICA, gerada pelo sistema (ficha + informações abaixo dela). Você poderá elaborar a sua ficha acessando o Sistema Gerador de Fichas Catalográficas online. https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/ficha-catalografica/ 03 – Na FOLHA DE APROVAÇÃO não é necessário colocar orientador abaixo da natureza da pesquisa. 04 – A data efetiva da defesa deve ser colocada no rodapé da FOLHA DE APROVAÇÃO: São José do Rio Preto 2 de setembro de 2021 05 – Solicitamos corrigir as Palavras-chave/keywords: iniciando com letras maiúsculas e separadas por ponto. 06 - A paginação deve ser sequencial, iniciando a contagem na FOLHA DE ROSTO e mostrando o número a partir da introdução, a FICHA CATALOGRÁFICA ficará após a folha de rosto, será contada caso o trabalho seja formatado em página, se for formatado como folhas não deverá ser contada, e na ficha catalográfica o número de folhas deve ser igual ao número da última folha do trabalho, para a numeração das páginas devem seguir um padrão. O correto ABNT 14724 no canto superior direito da folha. 07 - Caso você formate em páginas observar a margem, as margens devem ser: para o anverso, esquerda e superior de 3 cm e direita e inferior de 2 cm; para o verso, direita e superior de 3 cm e esquerda e inferior de 2 cm. Agora caso a impressão seja em folhas apenas selecione (f) ou página (p) na ficha. 08 – No Sumário falta colocar a indicação das Referências, o correto é REFERÊNCIAS e não REFERÊNCIAS BIBLIOGRÁFICAS e também a indicação dos Apêndices. 09 - Segundo a norma ABNT NBR 14724, os APÊNDICES são elementos pós-textuais e devem ser inseridos após as Referências e identificados por LETRA maiúscula(a letras após o nome da seção), sendo necessário também escrever o título. Ex: 5 Conclusões 44 Referências .................47 Apêndice A – Título .... 50 Apêndice B – Título .... 56 10 - Ilustrações e tabelas: a norma orienta que devem ter a descrição da fonte abaixo delas, mesmo que seja produção do autor (ABNT NBR 14724). 11 – Sugerimos não colocar CAPÍTULO no título no início das seções. Será que o seu arquivo desconfigurou? Os títulos das seções estão demasiadamente grandes. 12 - Todos os artigos, com a menção do periódico, que estejam no documento tem que ser verificados no banco de dados Sherpa Romeo. Então quanto aos artigos orientamos: Fonte consultada: Sherpa Romeo (compila as políticas de acesso aberto (OA) de periódicos) Artigo 1: International Journal of Wavelets, Multiresolution and Information Processing https://v2.sherpa.ac.uk/id/publication/9712 Para a disponibilização da versão publicada do artigo no Repositório é necessário ter pago uma taxa. Se isso se confirmar pode manter essa versão. Caso não tenha havido pagamento, é necessário trocar para a versão aceita, com as condições marcadas em vermelho. O prazo de embargo já encerrou, mas é importante descrever o DOI. Para ambos os casos, oriento inserir a referência completa do artigo. Pode ser abaixo da menção a ele no apêndice. (Inserir a data de acesso). GUIDO, R. C.; PEDROSO, F.; FURLAN, A.; CONTRERAS, R. C.; CAOBIANCO, L. G.; SUDA NETO, J. CWT x DWT x DTWT x SDTWT: clarifying terminologies and rolesof different types of wavelet transforms. International Journal of Wavelets, Multiresolution and Information Processing, Singapore, v. 18, n. 6 (2020), p. 2030001/1-5, Jul. 2020. DOI: https://doi.org/10.1142/S0219691320300017. Disponível em: https://www.worldscientific.com/doi/10.1142/S0219691320300017. Acesso em: dia mês ano. __________________________________________ Artigo 2: Digital Signal Processing https://v2.sherpa.ac.uk/id/publication/11283 Da mesma maneira, para a disponibilização da versão publicada do artigo no Repositório é necessário ter pago uma taxa. Se isso se confirmar pode manter essa versão. Parece-me que o artigo não tem a licença Creative Commons CC BY destacada. Poderia inserir a descrição dela, segundo a orientação do site. Senão, será necessário trocar para a versão aceita, com as condições marcadas em vermelho. Prazo de embargo de 24 meses no Repositório; inserir a licença Creative Commons CC BY-NC-ND. É importante descrever o DOI. Para ambos os casos, oriento inserir a referência completa do artigo. Pode ser abaixo da menção a ele no apêndice. (Inserir a data de acesso). GUIDO, R. C.; PEDROSO, F.; CONTRERAS, R. C.; RODRIGUES, L. C.; GUARIGLIA, E.; SUDA NETO, J. Introducing the Discrete Path Transform (DPT) and its applications in signal analysis, artefact removal, and spoken word recognition. Digital Signal Processing, Waltham, v. 117, p. 103158 (1-14), Oct. 2021. DOI: https://doi.org/10.1016/j.dsp.2021.103158. Disponível em: https://www.sciencedirect.com/science/article/pii/S1051200421001974. Acesso em: dia mês ano. Sugerimos que siga as orientações do template para as correções, na página da Biblioteca, link: https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/estrutura-do-trabalho-academico/ Lembramos que o arquivo depositado no Repositório deve ser igual ao impresso, o rigor com o padrão da Universidade se deve ao fato de que o seu trabalho passará a ser visível mundialmente. Agradecemos a compreensão. on 2021-10-23T23:48:18Z (GMT) Submitted by Fernando Pedroso (fernando.pedroso2@etec.sp.gov.br) on 2022-03-08T01:53:16Z No. of bitstreams: 1 Dissertação Fernando Pedroso - Defesa 02-09-2021.pdf: 3353481 bytes, checksum: e3ee521aec6d1f67ac333ef3d947e7a2 (MD5) Approved for entry into archive by Vivian Letícia Duarte Parisi (vivian.parisi@unesp.br) on 2022-03-08T15:05:35Z (GMT) No. of bitstreams: 1 pedroso_f_me_sjrp.pdf: 3353481 bytes, checksum: e3ee521aec6d1f67ac333ef3d947e7a2 (MD5) Made available in DSpace on 2022-03-08T15:05:35Z (GMT). No. of bitstreams: 1 pedroso_f_me_sjrp.pdf: 3353481 bytes, checksum: e3ee521aec6d1f67ac333ef3d947e7a2 (MD5) Previous issue date: 2021-09-02 Os avanços tecnológicos têm possibilitado cada vez mais a busca e a disseminação de informações e, com isso, o volume de dados gerados cresce extraordinariamente. Outro fator que contribui para este crescimento é o uso de dispositivos de Internet das Coisas (IoT), como Google Home e Amazon Alexa, e de outros assistentes de voz para permitir o gerenciamento de várias operações remotas em residências e escritórios. Assim, faz-se necessário o uso de sistemas para garantir o acesso e a segurança desses dados. Diante das pesquisas apresentadas, percebe-se a necessidade de maiores estudos no sentido de ampliar a eficiência dos sistemas de detecção dos ataques de reprodução eletrônica de voz (AREV), em especial os replay attacks, nos sistemas de autenticação biométrica por voz. Grande parte dos trabalhos correntes utiliza as mesmas técnicas e recursos para minimizar as possibilidades de fraudes. Particularmente, o estado-da-arte contempla vetores de características (VCs) baseados em análise espectral direta, coeficientes Q-cepstrais, filtragem digital, cepstrum, energias instantâneas e derivados, contando com classificadores dos tipos Support Vector Machines (SVMs), Gaussian Mixture Models (GMMs) e Deep Neural Networks (DNNs), avaliados nas bases ASVspoof 2015, ASVspoof 2017, ASVspoof 2019, RedDots, BTAS 2016 e, ainda, TIMIT. Diferentemente, neste trabalho experimentam-se VCs baseados no conceito de planaridade espectral e no Operador de Energia de Teager Aprimorado (OETA), obtidos artesanalmente, os quais são avaliados com base na Engenharia Paraconsistente de Características (EPC), considerando-se 21600 sinais da base ASVspoof 2019. Os resultados apresentados implicam a viabilidade da utilização da EPC para análise e seleção dos melhores VCs, independentemente de qualquer classificador, podendo-se observar ainda, nas características ótimas, a viabilidade do OETA em relação àquelas que não se baseiam nele. Os classificadores utilizados nos testes foram baseados em distâncias Euclidianas e SVMs de núcleos Gaussianos, produzindo uma equal error rate (EER) de 0.147 e uma acurácia superior a 90%. Technological advances have increasingly made it possible to search for and disseminate information and, as a result, the volume of data generated grows extraordinarily. Another factor contributing to this growth is the use of Internet of Things (IoT) devices, such as Google Home and Amazon Alexa, and other voice assistants to enable the management of various remote operations in homes and offices. Thus, it is necessary to use systems to ensure access and security of these data. In view of the research presented, there is a clear need for further studies in order to increase the efficiency of electronic voice reproduction (AREV) attack detection systems, especially replay attacks, in biometric voice authentication systems. Much of the current work uses the same techniques and resources to minimize the possibility of fraud. Particularly, the state-of-the-art includes feature vectors (VCs) based on direct spectral analysis, Q-cepstral coefficients, digital filtering, cepstrum, instantaneous energies and derivatives, counting on Support Vector Machines (SVMs), Gaussian Mixture classifiers Models (GMMs) and Deep Neural Networks (DNNs), evaluated on the basis of ASVspoof 2015, ASVspoof 2017, ASVspoof 2019, RedDots, BTAS 2016 and also TIMIT. Differently, in this work, VCs are tested based on the concept of spectral planarity and on the Enhanced Teager Power Operator (OETA), obtained by hand, which are evaluated based on the Paraconsistent Characteristics Engineering (EPC), considering 21600 signals from the base ASVspoof 2019. The results presented imply the feasibility of using EPC for the analysis and selection of the best VCs, regardless of any classifier, and it is also possible to observe, in the optimal characteristics, the feasibility of the OETA in relation to those that are not based on it. The classifiers used in the tests were based on Euclidean distances and SVMs of Gaussian cores, producing an equal error rate (EER) of 0.147 and an accuracy greater than 90%.