1. Individualisation d'indices acoustiques pour la synthèse binaurale
- Author
-
Busson, Sylvain, Laboratoire de Mécanique et d'Acoustique [Marseille] (LMA ), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), Université de la Méditerranée - Aix-Marseille II, Pierre-Olivier Mattei(mattei@lma.cnrs-mrs.fr), Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-École Centrale de Marseille (ECM), and Busson, Sylvain
- Subjects
neural network ,BEM ,Binaural synthesis ,réseaux de neurones artificiels ,filtre à phase minimale ,psychoacoustics ,son 3D ,[PHYS.MECA.ACOU]Physics [physics]/Mechanics [physics]/Acoustics [physics.class-ph] ,3D sound ,JND ,ITD ,minimum phase filter ,Synthèse binaurale ,HRTF ,psychoacoustique ,[PHYS.MECA.ACOU] Physics [physics]/Mechanics [physics]/Acoustics [physics.class-ph] - Abstract
Binaural synthesis is a sound spatialization technology, which is the closest to na-tural hearing. It allows the spatialization of a monophonic sound source with only twofilters for a given position. The filters are defined by the HRTFs (Head Related TransferFunction) corresponding to the left and right ear of the listener. The major drawback ofbinaural synthesis is that the HRTF, which are related to the listener's morphology, arestrongly individual. Listening with non-individual HRTF could lead to audible artifacts.Therefore binaural rendering of high quality requires individualized HRTF. This thesistackles the problem of the individualization of binaural synthesis in the framework ofits implementation as a pure delay, the interaural time di®erence (ITD), and a minimalphase filter determined by the magnitude of the HRTF. The work conducted on the ITDvalidates the implementation chosen even for the positions where the HRTF are poorlyminimum phase filters. In addition the ITD calculation methods which are close to per-ception are pointed out. An experimental study is also undertaken to investigate theresolution of the ITD with the elevation angle along the cones of confusion. Perceptualresults indicate that the ITD variation with the elevation angle needs to be reproduced.In order to account for this variation, a new formula is proposed on the basis of thespherical head model. Optimization of the parameters of this formula for a whole ITDdatabase provides an average formulation which is appropriate for a large number of sub-jects and for many applications. Concerning the modeling of the spectral cues (HRTFmagnitude), the Boundary Element Method (BEM) has been examined. It is concludedthat BEM methods are useful in combination with measurement for the modeling ofthe low frequency part. A new approach, which involves statistical learning technique, isproposed for the HRTF prediction. A neural network is built to compute HRTF in anydirection from a limited set of measured HRTF. Preliminary assessment of this modelingshows that the neural network succeeds well in individualizing spectral cues. This resultsuggests a simplified protocol of HRTF measurement : HRTF are measured for only afew directions and the HRTF for the other locations are obtained by the neural network., La synthèse binaurale est la technique de spatialisation sonore la plus proche del'écoute naturelle. Elle permet un rendu spatialisé d'une source monophonique à une po-sition donnée avec seulement deux filtres qui correspondent aux oreilles gauche et droite :les HRTF (Head Related Transfer Function). L'inconvénient majeur de la technique bi-naurale repose sur le fait que les HRTF, liées à la morphologie de l'auditeur, sont propresà chaque utilisateur. Une écoute avec des HRTF non-individuelles comporte des artefactsaudibles. Il faut donc acquérir des HRTF individuelles. Cette thèse aborde le problèmede l'individualisation de la synthèse binaurale dans le cadre de son implémentation en unretard pur, la différence interaurale de temps (ITD), et un filtre à phase minimale déter-miné par le module de la HRTF. Le travail sur l'ITD permet de valider l'implémentationchoisie même pour les positions où les HRTF sont mal décrites par des filtres à phaseminimale et permet de déterminer, parmi les méthodes classiques de calcul de l'ITD,celles qui estiment une ITD proche de la perception. Une étude expérimentale est aussimenée pour établir la résolution de l'ITD avec l'angle d'élévation. Les résultats indiquentla nécessité perceptive de reproduire les variations de l'ITD en élévation. Une nouvelleformule d'estimation de l'ITD créée sur la base d'un modèle de tête sphérique, la formulede déplacement des oreilles (FDO), est développée pour rendre compte de ces variations.L'optimisation des paramètres de cette formule aux ITD de toute une base de donnéesde HRTF permet d'entrevoir une formulation moyenne convenant pour un grand nombrede personne et pour de nombreuses applications. L'étude s'est ensuite focalisée sur lamodélisation du module spectral (filtre à phase minimale). Le travail réalisé sur l'appli-cation des méthodes de calcul par éléments de frontière (BEM pour Boundary ElementMethod) pour l'acquisition de HRTF, indique que cette méthode, peut notamment êtreutilisée en complément des mesures pour l'acquisition de la partie basse fréquence desHRTF. Une approche originale, qui applique des techniques d'apprentissage statistique,est proposée et étudiée pour la modélisation de HRTF. Un réseau de neurones artificiels(RNA) est entra^³né pour calculer des HRTF d'un individu à partir de la connaissancedes HRTF mesurées en un nombre réduit de positions. Les premiers résultats sont en-courageants : le modèle permet d'atteindre un degré assez fin d'individualisation, ce quisuggère un protocole simplifié d'acquisition de HRTF. Un faible nombre de mesures estacquis et les autres sont prédites par le modèle.
- Published
- 2006