1. Konuşma sinyallerinin zaman ölçeği ve ses tonunun dalgacık dönüşümüne dayalı olarak çok çözünürlüklü değiştirilmesi
- Author
-
Eroğul, Osman, Tüzünalp, Önder, and Elektrik-Elektronik Mühendisliği Anabilim Dalı
- Subjects
Elektrik ve Elektronik Mühendisliği ,Voice coding ,Voice compression ,Electrical and Electronics Engineering - Abstract
ÖZET Doktora Tezi KONUŞMA SİNYALLERİNİN ZAMAN ÖLÇE?İ VE SES TONUNUN DALGACIK DÖNÜŞÜMÜNE DAYALI OLARAK ÇOK ÇÖZÜNÜRLÜKLÜ DE?İŞTİRİLMESİ Osman Eroğul Ankara Üniversitesi Fen Bilimleri Enstitüsü Elektronik Müh. Ana Bilim Dalı Danışman: Prof. Dr. Önder TÜZÜNALP 1997, Sayfa: 134 Jüri : Prof. Dr. Önder TÜZÜNALP Prof. Dr. Mümtaz YILMAZ Prof. Dr. Mustafa KAHRAMANYOL Bu tez çalışmasında, konuşma sinyallerinin zaman ölçeği ve tonunun değiştirilmesi için yeni bir çok çözünürlüklü analiz/sentez yöntemi sunulmuştur. Diğer yöntemlerden farklı olarak, bu yöntem konuşma sinyalinin kendisini değiştirmek yerine sinyalin dalgacık katsayılarım değiştirir. Bu yöntemde sinyal önce, zaman ölçeği ve ses tonu değiştirme algoritmalarına daha ayrıntılı zaman ve frekans bilgisi sağlamak amacıyla, 1 1 -aşamalı QMF süzgeç öbeği kullanılarak altbantlara ayrılmıştır. Bu altbantlar daha sonra değişik zaman ölçeği veya ses tonu değiştirme algoritmaları kullanılarak değiştirilmiştir. Son olarak, giriş sinyalinin zaman ölçeği veya ses tonu değiştirilmiş biçimini elde etmek için, değiştirelen bu altbant katsayılarına ters dalgacık dönüşümü uygulanmıştır. Çok çözünürlüklü analiz/sentez algoritmasının performansı bir dizi taraflı dinleme testleri uygulanarak değerlendirilmiştir. Konuşma sinyalleri zaman ölçeğinin çok çözünürlüklü olarak değiştirilmesinin; tanınmış zaman ölçeği değiştirme algoritmalarıyla kıyaslandığında, yeniden oluşturulan sinyalin anlaşılırlığını arttırdığı ve istenilen oranda zaman ölçeği değiştirilmiş yüksek kaliteli konuşma ve müzik sinyali ürettiği gösterilmiştir. Ayrıca, konuşma sinyallerinin ses tonunun çok çözünürlüklü değiştirilmesinin; tanınmış ses tonu değiştirme algoritmalanyla kıyaslandığında ses tonu değiştirilmiş sinyalin kalitesini arttırdığı gösterilmiştir. ANAHTAR KELİMELER: Konuşma Sinyalleri, Zaman Ölçeği ve Ses Tonu Değiştirme, Dalgacık Dönüşümü, Altbant, QMF öbeği, Değerlendirme Testleri ABSTRACT Ph. D. Thesis MULTIRESOLUTIONAL TIME-SCALE AND PITCH MODIFICATION OF SPEECH SIGNALS BASED ON WAVELET TRANSFORM Osman Eroğul Ankara University Graduate School of Natural and Applied Sciences Department of Electronics Engineering Supervisor: Prof. Dr. Önder TÜZÜNALP 1997, Page: 134 Jury : Prof. Dr. Önder TÜZÜNALP Prof. Dr. Mümtaz YILMAZ Prof. Dr. Mustafa KAHRAMANYOL In this thesis, a new multiresolutional analysis/synthesis algorithm has been studied for the time-scale and pitch modification of speech signals. Unlike other methods proposed in the literature, this algorithm modifies the wavelet coefficients of the speech signal instead of modifying the speech waveform itself. In this method the speech signal is first divided into subbands using an 11 -level Quadrature Mirror Filter Bank (QMF) in order to obtain more accurately localized temporal and frequency information for the modification algorithm. These subbands are then modified using the various time-scale and pitch modification algorithms. Finally, the inverse wavelet transform is applied to these modified subband coefficients in order to reconstruct a modified version of the input signal. The performance of the multiresolutional analysis/synthesis algorithm is evaluated through a series of subjective listening tests. It has been demonstrated that the multiresolutional time-scale modification (MTSM) of speech signals increases the intelligibility of the reconstructed speech over the well-known time-scale modification algorithms and produces high quality speech and music with the desired time scale. It has also been shown that the multiresolutional pitch modification (MPM) of speech signals, with the desired pitch modification factor, increases the quality of the pitch-modified speech over the well-known pitch modification algorithms. Key Words : Speech Signals, Time-Scale and Pitch Modification, Wavelet Transform, Subband, QMF Bank, Evaluation Tests 147
- Published
- 1997