Back to Search Start Over

Séparation de sources audio informée par tatouage pour mélanges linéaires instantanés stationnaires

Authors :
Parvaix, Mathieu
Grenoble Images Parole Signal Automatique (GIPSA-lab)
Université Stendhal - Grenoble 3-Université Pierre Mendès France - Grenoble 2 (UPMF)-Université Joseph Fourier - Grenoble 1 (UJF)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)
Institut National Polytechnique de Grenoble - INPG
Laurent Girin(Laurent.Girin@gipsa-lab.grenoble-inp.fr)
projet ANR DReaM
Source :
Sciences de l'ingénieur [physics]. Institut National Polytechnique de Grenoble-INPG, 2010. Français
Publication Year :
2010
Publisher :
HAL CCSD, 2010.

Abstract

The source separation issue is addressed, in this PhD thesis, with an innovative point of view. This work joint associates two main domains in the signal processing area : digital watermarking and source separation which are most of the time considered unrelated. Our work aims at giving a "client-user" the possibility to separate different digital source signals that have been mixed together by the only use of their single mixture. To enable such a separation, a watermark is embedded by a "provider-user" into the signal before the mixture has been fixed on its digital support. This watermark which has to be imperceptibly inserted into the signal is made of several pieces of information from original signals. The message can be embedded either directly on source signals available to the "provider" before they are mixed or onto the mixture signal. This method is composed of two main parts, a coder where a "provider" can mix signals and embed the watermark, and a decoder where a client can control the separation based on the mixture signal study. In the present work, it was chosen to embed the watermark into the mixture signal. A typical application addressed by the proposed method is the process of Audio-CD polyphonic (stereo) music. The informed separation must enable a client to control several parameters (such as volume) of the different sources (instruments, voices) that compose the audio scene.; Nous abordons dans cette thèse le problème de la séparation de sources selon un angle novateur à de nombreux niveaux. Ces travaux associent deux domaines du traitement du signal jusqu'alors traités de manière disjointe, la séparation de source et le tatouage numérique. Le procédé mis en place au cours de ces travaux a pour but de permettre à un utilisateur "client" de séparer les différents signaux numériques sources composant un mélange audio à partir de ce seul mélange tatoué. Pour ce faire un marquage du signal est effectué par un utilisateur "fournisseur" avant la fixation du mélange sur son support numérique. Ce marquage consiste en l'insertion sur le signal lui-même d'informations utiles à la séparation, et ceci de façon imperceptible. Le tatouage peut, en principe, être inséré soit sur le mélange, soit sur les signaux sources, qui sont disponibles à l'utilisateur fournisseur. Deux systèmes composent donc ce procédé, un encodeur qui permet à l'utilisateur fournisseur de réaliser la phase de mélange et de marquage, et un décodeur qui permet à l'utilisateur client de contrôler la séparation à partir du mélange. Au cours de cette thèse, il est choisi de tatouer le signal de mélange. Une application cible particulièrement visée est le cas d'un mélange polyphonique (signal de musique) fixé sur un support CD audio. La séparation doit permettre à l'utilisateur client d'effectuer un certain nombre de contrôles (par exemple le volume sonore) sur les différentes composantes de la scène sonore (les différents instruments et voix).

Details

Language :
French
Database :
OpenAIRE
Journal :
Sciences de l'ingénieur [physics]. Institut National Polytechnique de Grenoble-INPG, 2010. Français
Accession number :
edsair.od......2592..d334b5cd22c2becf88b7ca3085558ad9