69 results on '"Valentin Emiya"'
Search Results
2. Vessel Behaviour Classification from AIS Without Geographical Biases.
- Author
-
Raphael Sturgis, Valentin Emiya, Basile Couëtoux, and Pierre Garreau
- Published
- 2022
- Full Text
- View/download PDF
3. Filtering Out Time-Frequency Areas Using Gabor Multipliers.
- Author
-
A. Marina Krémé, Valentin Emiya, Caroline Chaux, and Bruno Torrésani
- Published
- 2020
- Full Text
- View/download PDF
4. Characterization of Finite Signals with Low-Rank Stft.
- Author
-
Konstantin Usevich, Valentin Emiya, David Brie, and Caroline Chaux
- Published
- 2018
- Full Text
- View/download PDF
5. Phase Reconstruction for Time-Frequency Inpainting.
- Author
-
A. Marina Krémé, Valentin Emiya, and Caroline Chaux
- Published
- 2018
- Full Text
- View/download PDF
6. Sparse Non-Local Similarity Modeling for Audio Inpainting.
- Author
-
Ichrak Toumi and Valentin Emiya
- Published
- 2018
- Full Text
- View/download PDF
7. Being Low-Rank in the Time-Frequency Plane.
- Author
-
Valentin Emiya, Ronan Hamon, and Caroline Chaux
- Published
- 2018
- Full Text
- View/download PDF
8. Assessment of musical noise using localization of isolated peaks in time-frequency domain.
- Author
-
Ronan Hamon, Valentin Emiya, Lucas Rencker, Wenwu Wang 0001, and Mark D. Plumbley
- Published
- 2017
- Full Text
- View/download PDF
9. Optimal spectral transportation with application to music transcription.
- Author
-
Rémi Flamary, Cédric Févotte, Nicolas Courty, and Valentin Emiya
- Published
- 2016
10. Convex nonnegative matrix factorization with missing data.
- Author
-
Ronan Hamon, Valentin Emiya, and Cédric Févotte
- Published
- 2016
- Full Text
- View/download PDF
11. A dynamic screening principle for the Lasso.
- Author
-
Antoine Bonnefoy, Valentin Emiya, Liva Ralaivola, and Rémi Gribonval
- Published
- 2014
12. Compressed sensing with unknown sensor permutation.
- Author
-
Valentin Emiya, Antoine Bonnefoy, Laurent Daudet, and Rémi Gribonval
- Published
- 2014
- Full Text
- View/download PDF
13. Formalizing the Problem of Music Description.
- Author
-
Bob L. Sturm, Rolf Bardeli, Thibault Langlois, and Valentin Emiya
- Published
- 2014
14. Beyond Geofencing: Behavior Detection Using Ais
- Author
-
Raphael David Sturgis, Valentin Emiya, Basile Couëtoux, and Pierre Garreau
- Published
- 2023
15. The problem of musical gesture continuation and a baseline system.
- Author
-
Charles Bascou, Valentin Emiya, and Mathieu Laurière
- Published
- 2016
16. Matching pursuit with stochastic selection.
- Author
-
Thomas Peel, Valentin Emiya, Liva Ralaivola, and Sandrine Anthoine
- Published
- 2012
17. Sparse underwater acoustic imaging: A case study.
- Author
-
Nikolaos Stefanakis, Jacques Marchal, Valentin Emiya, Nancy Bertin, Rémi Gribonval, and Pierre Cervenka
- Published
- 2012
- Full Text
- View/download PDF
18. A constrained matching pursuit approach to audio declipping.
- Author
-
Amir Adler, Valentin Emiya, Maria G. Jafari, Michael Elad, Rémi Gribonval, and Mark D. Plumbley
- Published
- 2011
- Full Text
- View/download PDF
19. Expectation-maximization algorithm for multi-pitch estimation and separation of overlapping harmonic spectra.
- Author
-
Roland Badeau, Valentin Emiya, and Bertrand David 0002
- Published
- 2009
- Full Text
- View/download PDF
20. An investigation of discrete-state discriminant approaches to single-sensor source separation.
- Author
-
Valentin Emiya, Emmanuel Vincent 0001, and Rémi Gribonval
- Published
- 2009
- Full Text
- View/download PDF
21. Automatic transcription of piano music based on HMM tracking of jointly-estimated pitches.
- Author
-
Valentin Emiya, Roland Badeau, and Bertrand David 0002
- Published
- 2008
22. Perceptually-Based Evaluation of the Errors Usually Made When Automatically Transcribing Music.
- Author
-
Adrien Daniel, Valentin Emiya, and Bertrand David 0002
- Published
- 2008
23. A Parametric Method for Pitch Estimation of Piano Tones.
- Author
-
Valentin Emiya, Bertrand David 0002, and Roland Badeau
- Published
- 2007
- Full Text
- View/download PDF
24. QuicK-means: accelerating inference for K-means by learning fast transforms
- Author
-
Valentin Emiya, Liva Ralaivola, Hachem Kadri, and Luc Giffon
- Subjects
Discrete mathematics ,Kernel (set theory) ,Dimension (graph theory) ,k-means clustering ,02 engineering and technology ,Matrix (mathematics) ,Factorization ,Artificial Intelligence ,020204 information systems ,Product (mathematics) ,0202 electrical engineering, electronic engineering, information engineering ,020201 artificial intelligence & image processing ,Cluster analysis ,Software ,Sparse matrix ,Mathematics - Abstract
K-means—and the celebrated Lloyd’s algorithm—is more than the clustering method it was originally designed to be. It has indeed proven pivotal to help increase the speed of many machine learning, data analysis techniques such as indexing, nearest-neighbor search and prediction, data compression and, lately, inference with kernel machines. Here, we introduce an efficient extension of K-means, dubbed QuicK-means, that rests on the idea of expressing the matrix of the $$K$$ cluster centroids as a product of sparse matrices, a feat made possible by recent results devoted to find approximations of matrices as a product of sparse factors. Using such a decomposition squashes the complexity of the matrix-vector product between the factorized $$K\times D$$ centroid matrix $${\mathbf {U}}$$ and any vector from $${\mathcal {O}}\left( KD\right)$$ to $${\mathcal {O}}\left( A \log B~ +B\right)$$ , with $$A=\min \left( K,D\right)$$ and $$B=\max \left( K,D\right)$$ , where $$D$$ is the dimension of the data. This drastic computational saving has a direct impact in the assignment process of a point to a cluster. We propose to learn such a factorization during the Lloyd’s training procedure. We show that resorting to a factorization step at each iteration does not impair the convergence of the optimization scheme, and demonstrate the benefits of our approach experimentally.
- Published
- 2021
25. Editorial: Reconstruction of Audio From Incomplete or Highly Degraded Observations
- Author
-
Alexey Ozerov, Nicki Holighaus, Pavel Rajmic, Valentin Emiya, and Nancy Bertin
- Subjects
Focus (computing) ,Information retrieval ,Computer science ,Signal Processing ,Section (typography) ,Special section ,Electrical and Electronic Engineering ,Audio signal processing ,computer.software_genre ,computer ,Field (computer science) - Abstract
The papers from this special section focus on the restoration of udio content, in particular speech and music from degraded observations. This is a challenging and long-standing problem in audio processing. In particular this holds for severe degradations and incomplete observations, which are regularly encountered in practice. The papers in this section have been organized to gather contributions that would serve both as a comprehensive primer on the stateof- the-art, and a showcase of current developments within the field.
- Published
- 2021
26. Recovery and Convergence Rate of the Frank–Wolfe Algorithm for the m-Exact-Sparse Problem
- Author
-
Valentin Emiya, Sandrine Anthoine, Liva Ralaivola, and Farah Cherfaoui
- Subjects
Frank–Wolfe algorithm ,Rate of convergence ,Computer science ,Approximation algorithm ,Coherence (signal processing) ,Sparse approximation ,Library and Information Sciences ,Linear combination ,Algorithm ,Computer Science Applications ,Information Systems - Abstract
We study the properties of the Frank–Wolfe algorithm to solve the m-Exact-Sparse reconstruction problem, where a signal $y$ must be expressed as a sparse linear combination of a predefined set of atoms, called dictionary . We prove that when the signal is sparse enough with respect to the coherence of the dictionary, then the iterative process implemented by the Frank–Wolfe algorithm only recruits atoms from the support of the signal, is the smallest set of atoms from the dictionary that allows for a perfect reconstruction of $y$ . We also prove that under this same condition, there exists an iteration beyond which the algorithm converges exponentially.
- Published
- 2019
27. QuicK-means: Acceleration of K-means by learning a fast transform
- Author
-
Luc Giffon, Valentin Emiya, Hachem Kadri, Liva Ralaivola, éQuipe d'AppRentissage de MArseille (QARMA), Laboratoire d'Informatique et Systèmes (LIS), Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS), Criteo [Paris], and ANR-16-CE23-0006,Deep_in_France,Réseaux de neurones profonds pour l'apprentissage(2016)
- Subjects
FOS: Computer and information sciences ,Computer Science - Machine Learning ,[INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,Statistics - Machine Learning ,[INFO.INFO-SD]Computer Science [cs]/Sound [cs.SD] ,Machine Learning (stat.ML) ,Machine Learning (cs.LG) ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; K-means -- and the celebrated Lloyd algorithm -- is more than the clustering method it was originally designed to be. It has indeed proven pivotal to help increase the speed of many machine learning and data analysis techniques such as indexing, nearest-neighbor search and prediction, data compression, Radial Basis Function networks; its beneficial use has been shown to carry over to the acceleration of kernel machines (when using the Nyström method). Here, we propose a fast extension of K-means, dubbed QuicK-means, that rests on the idea of expressing the matrix of the $K$ centroids as a product of sparse matrices, a feat made possible by recent results devoted to find approximations of matrices as a product of sparse factors. Using such a decomposition squashes the complexity of the matrix-vector product between the factorized $K \times D$ centroid matrix $\mathbf{U}$ and any vector from $\mathcal{O}(K D)$ to $\mathcal{O}(A \log A+B)$, with $A=\min (K, D)$ and $B=\max (K, D)$, where $D$ is the dimension of the training data. This drastic computational saving has a direct impact in the assignment process of a point to a cluster, meaning that it is not only tangible at prediction time, but also at training time, provided the factorization procedure is performed during Lloyd's algorithm. We precisely show that resorting to a factorization step at each iteration does not impair the convergence of the optimization scheme and that, depending on the context, it may entail a reduction of the training time. Finally, we provide discussions and numerical simulations that show the versatility of our computationally-efficient QuicK-means algorithm.
- Published
- 2021
28. Time-Frequency Fading Algorithms Based on Gabor Multipliers
- Author
-
Valentin Emiya, Caroline Chaux, Bruno Torrésani, A. Marina Kreme, Institut de Mathématiques de Marseille (I2M), Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU), éQuipe d'AppRentissage de MArseille (QARMA), Laboratoire d'Informatique et Systèmes (LIS), Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS), Région Sud, Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), and ANR-16-CONV-0002,ILCB,ILCB: Institute of Language Communication and the Brain(2016)
- Subjects
Optimization problem ,Computer science ,time-varying filtering ,Random projection ,Fading channels ,02 engineering and technology ,Perturbation methods ,Transfer function ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,0202 electrical engineering, electronic engineering, information engineering ,Fading ,Electrical and Electronic Engineering ,Gabor multipliers ,Manganese ,Eigenvalues and eigenfunctions ,Audio signal ,randomized optimization ,Signal reconstruction ,time-frequency fading ,020206 networking & telecommunications ,Lattices ,Transforms ,Time–frequency analysis ,Time-frequency analysis ,Filter design ,Signal Processing ,Algorithm ,[MATH.MATH-SP]Mathematics [math]/Spectral Theory [math.SP] - Abstract
International audience; In this paper, we address a particular instance of time-frequency filter design, which we call Time-Frequency Fading (TFF). In TFF the only available information concerns the time-frequency localization of the component to be filtered out or attenuated: the signal of interest is supposed to be spread out in the time-frequency plane, whereas the perturbation signal is concentrated within a specified time-frequency region Ω . The problem is formulated as an optimization problem designed to fade out the perturbation with accurate control on the fading level. The corresponding objective function involves a data fidelity term that aims to match the TF coefficients of the estimated signal to those of the observed signal outside the perturbation support. It also involves a penalty term that controls the energy of the reconstructed signal, within that region. We obtain the closed-form solution of the problem which involves Gabor multipliers, i.e. linear operators of the pointwise product by a time-frequency transfer function called a mask. We study the TF localization properties of dominant eigenvectors of these Gabor multipliers, with particular attention to the case where the region Ω is a disjoint union of several sub-regions. The decay properties of eigenvalues naturally lead to reduced-rank approximations, and further approximations are obtained in the multiply connected region case. Also, we exploit random projection methods to speed up eigenvalue decompositions and rank reduction. This is implemented in two TFF algorithms, that cover the cases of single or multiple regions. The efficiency of the proposed approach is demonstrated on several audio signals where the perturbations are filtered while leading to a good quality of signal reconstruction.
- Published
- 2021
29. Recovery and convergence rate of the Frank-Wolfe Algorithm for the m-EXACT-SPARSE Problem
- Author
-
Farah Cherfaoui, Valentin Emiya, Liva Ralaivola, Sandrine Anthoine, éQuipe d'AppRentissage de MArseille (QARMA), Laboratoire d'Informatique et Systèmes (LIS), Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS), Criteo [Paris], Institut de Mathématiques de Marseille (I2M), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), and ANR-14-CE27-0002,MAD,Inpainting de données audio manquantes(2014)
- Subjects
Signal Processing (eess.SP) ,recovery properties ,Frank-Wolfe algorithm ,exponential convergence ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,Optimization and Control (math.OC) ,FOS: Mathematics ,FOS: Electrical engineering, electronic engineering, information engineering ,Mathematics - Category Theory ,Category Theory (math.CT) ,Electrical Engineering and Systems Science - Signal Processing ,sparse representation ,Mathematics - Optimization and Control - Abstract
International audience; We study the properties of the Frank-Wolfe algorithm to solve the m-EXACT-SPARSE reconstruction problem, where a signal y must be expressed as a sparse linear combination of a predefined set of atoms, called dictionary. We prove that when the signal is sparse enough with respect to the coherence of the dictionary, then the iterative process implemented by the Frank-Wolfe algorithm only recruits atoms from the support of the signal, that is the smallest set of atoms from the dictionary that allows for a perfect reconstruction of y. We also prove that under this same condition, there exists an iteration beyond which the algorithm converges exponentially.
- Published
- 2019
30. Joint-sparse modeling for audio inpainting
- Author
-
Ichrak Toumi, Valentin Emiya, éQuipe d'AppRentissage de MArseille (QARMA), Laboratoire d'Informatique et Systèmes (LIS), Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS), ANR-14-CE27-0002,MAD,Inpainting de données audio manquantes(2014), and Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)
- Subjects
[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,[INFO.INFO-SD]Computer Science [cs]/Sound [cs.SD] - Abstract
International audience; We exploit the common sparse structure between similar audio frames in order to reconstruct missing samples in audio signals.While joint-sparse models and related algorithms have been widely studied, one important challenge is to locate such similar frames in a fast way and when some samples are missing.We propose and compare several similarity measures dedicated to this task.We then show how this leads to better reconstruction results than when processing the audio frames independently.
- Published
- 2018
31. Frank-Wolfe Algorithm for the Exact Sparse Problem
- Author
-
Farah Cherfaoui, Valentin Emiya, Liva Ralaivola, Sandrine Anthoine, éQuipe d'AppRentissage de MArseille (QARMA), Laboratoire d'Informatique et Systèmes (LIS), Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS), Criteo [Paris], Institut de Mathématiques de Marseille (I2M), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), and ANR-14-CE27-0002,MAD,Inpainting de données audio manquantes(2014)
- Subjects
FOS: Computer and information sciences ,Computer Science - Machine Learning ,[INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,Statistics - Machine Learning ,Machine Learning (stat.ML) ,Data_CODINGANDINFORMATIONTHEORY ,Machine Learning (cs.LG) - Abstract
International audience; In this paper, we study the properties of the Frank-Wolfe algorithm to solve the \ExactSparse reconstruction problem. We prove that when the dictionary is quasi-incoherent, at each iteration, the Frank-Wolfe algorithm picks up an atom indexed by the support. We also prove that when the dictionary is quasi-incoherent, there exists an iteration beyond which the algorithm converges exponentially fast.
- Published
- 2018
32. Being low-rank in the time-frequency plane
- Author
-
Caroline Chaux, Valentin Emiya, Ronan Hamon, éQuipe d'AppRentissage de MArseille (QARMA), Laboratoire d'Informatique et Systèmes (LIS), Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS), Institut de Mathématiques de Marseille (I2M), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), ANR-14-CE27-0002,MAD,Inpainting de données audio manquantes(2014), and Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)
- Subjects
Signal processing ,Rank (linear algebra) ,Short-time Fourier transform ,020206 networking & telecommunications ,02 engineering and technology ,Time–frequency analysis ,Non-negative matrix factorization ,symbols.namesake ,Matrix (mathematics) ,Fourier transform ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,Computer Science::Sound ,0202 electrical engineering, electronic engineering, information engineering ,symbols ,Spectrogram ,Algorithm ,Mathematics - Abstract
International audience; When solving inverse problems and using optimization methods with matrix variables in signal processing and machine learning, it is customary to assume some low-rank prior on the targeted solution. Nonnegative matrix factorization of spectrograms is a case in point in audio signal processing. However, this low-rank prior is not straightforwardly related to complex matrices obtained from a short-time Fourier – or discrete Gabor – transform (STFT), which is generally defined from and studied based on a modulation operator and a translation operator applied to a so-called window. This paper is a first study of the low-rankness property of time-frequency matrices. We characterize the set of signals with a rank-r (complex) STFT matrix in the case of a unit hop size and frequency step with few assumptions on the transform parameters. We discuss the scope of this result and its implications on low-rank approximations of STFT matrices.
- Published
- 2018
33. Phase Reconstruction for Time-Frequency Inpainting
- Author
-
Valentin Emiya, Caroline Chaux, A. Marina Kreme, Institut de Mathématiques de Marseille (I2M), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), éQuipe d'AppRentissage de MArseille (QARMA), Laboratoire d'Informatique et Systèmes (LIS), Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS), ANR-14-CE27-0002,MAD,Inpainting de données audio manquantes(2014), and Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)
- Subjects
inpainting ,SDP optimization ,Inpainting ,02 engineering and technology ,time-frequency ,PhaseCut ,missing data ,030507 speech-language pathology & audiology ,03 medical and health sciences ,symbols.namesake ,audio ,Convergence (routing) ,0202 electrical engineering, electronic engineering, information engineering ,[INFO]Computer Science [cs] ,[MATH]Mathematics [math] ,Mathematics ,PhaseLift ,Signal reconstruction ,Short-time Fourier transform ,020206 networking & telecommunications ,Inverse problem ,Missing data ,Time–frequency analysis ,Fourier transform ,short-time Fourier transform ,symbols ,phase reconstruction ,0305 other medical science ,Algorithm - Abstract
International audience; We address the problem of phase inpainting, i.e. the reconstruction of partially-missing phases in linear measurements. We thus aim at reconstructing missing phases of some complex coefficients assuming that the phases of the other coefficients as well as the modulus of all coefficients are known. The mathematical formulation of the inverse problem is first described and then, three methods are proposed: a first one based on the well known Griffin and Lim algorithm and two other ones based on positive semidefinite programming (SDP) optimization methods namely PhaseLift and PhaseCut, that are extended to the case of partial phase knowledge. The three derived algorithms are tested with measurements from a short-time Fourier transform (STFT) in two situations: the case where the missing data are distributed uniformly and indepedently at random and the case where they constitute holes with a given width. Results show that the knowledge of a subset of phases contributes to improve the signal reconstruction and to shorten the convergence of the optimization process.
- Published
- 2018
34. De la faiblesse de rang en temps-fréquence
- Author
-
Ronan Hamon, Caroline Chaux, Valentin Emiya, éQuipe AppRentissage et MultimediA [Marseille] (QARMA), Laboratoire d'informatique Fondamentale de Marseille (LIF), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), Institut de Mathématiques de Marseille (I2M), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), ANR-14-CE27-0002,MAD,Inpainting de données audio manquantes(2014), Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU), Emiya, Valentin, and Appel à projets générique - Inpainting de données audio manquantes - - MAD2014 - ANR-14-CE27-0002 - Appel à projets générique - VALID
- Subjects
[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,[INFO.INFO-TS] Computer Science [cs]/Signal and Image Processing - Abstract
The low-rank assumption for spectrogram has been widely used recently for the analysis of audio signals. In this paper, we are interested in time-frequency representations, and more particularly in the rank of the matrix of coefficients obtained after a Short-Time Fourier Transform (STFT). We show that the rank depends on the adopted convention to compute the STFT, and that its behaviour is similar to the one of spectrograms. We apply this result to an audio restoration problem, where missing data are present in the time-frequency plane. The missing complex coefficients are retrieved using a proximal algorithm minimizing the nuclear norm of the STFT matrix, accounting for the low-rank assumption., L'hypothèse de faible rang des spectrogrammes a été largement utilisée ces dernières années pour l'analyse des signaux audio. Dans cet article, nous nous intéressons à la représentation temps-fréquence de signaux, et plus particulièrement au rang de la matrice de coefficients issus d'une transformée de Fourier à court terme (TFCT). Nous montrons que ce rang dépend de la convention adoptée pour la TFCT et que le comportement du rang se rapproche de celui observé pour le spectrogramme. Nous appliquons ces résultats à un problème de restauration de données manquantes dans le domaine temps-fréquence. Les coefficients complexes sont reconstruits au travers d'un algorithme proximal prenant en compte l'a priori de faible rang de la matrice des coefficients.
- Published
- 2017
35. Factorisation archétypale en matrices non-négatives avec données manquantes
- Author
-
Ronan Hamon, Valentin Emiya, Cédric Févotte, éQuipe AppRentissage et MultimediA [Marseille] (QARMA), Laboratoire d'informatique Fondamentale de Marseille (LIF), Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU), Signal et Communications (IRIT-SC), Institut de recherche en informatique de Toulouse (IRIT), Université Toulouse 1 Capitole (UT1)-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1)-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées, Joseph Louis LAGRANGE (LAGRANGE), Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015 - 2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015 - 2019) (COMUE UCA)-Observatoire de la Côte d'Azur, Université Côte d'Azur (UCA)-COMUE Université Côte d'Azur (2015 - 2019) (COMUE UCA)-Université Côte d'Azur (UCA)-Centre National de la Recherche Scientifique (CNRS), éQuipe d'AppRentissage de MArseille (QARMA), Laboratoire d'Informatique et Systèmes (LIS), Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS), Université Toulouse Capitole (UT Capitole), Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse - Jean Jaurès (UT2J), Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université de Toulouse (UT)-Toulouse Mind & Brain Institut (TMBI), Université Toulouse - Jean Jaurès (UT2J), Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université Toulouse Capitole (UT Capitole), Université de Toulouse (UT), Université Nice Sophia Antipolis (1965 - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Institut national des sciences de l'Univers (INSU - CNRS)-Observatoire de la Côte d'Azur, COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Université Côte d'Azur (UCA)-Université Côte d'Azur (UCA)-Centre National de la Recherche Scientifique (CNRS), Centre National de la Recherche Scientifique (CNRS), ANR-14-CE27-0002,MAD,Inpainting de données audio manquantes(2014), Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Université de Toulon (UTLN)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU), Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1), and Université Côte d'Azur (UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Université Côte d'Azur (UCA)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
factorisation en matrices non-négatives ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,[INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] ,inpainting ,[INFO]Computer Science [cs] ,rang faible ,complétion de matrices ,ComputingMilieux_MISCELLANEOUS ,données manquantes ,[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI] - Abstract
International audience; L'analyse archétypale (AA), ou factorisation convexe en matrices non-négatives (CNMF), est une variante de la factorisation en matrices non-négatives (NMF), dans laquelle les composantes obtenues sont exprimées comme une combinaison convexe d'exemples appelés archétypes. Dans cette contribution, nous proposons d'étendre AA/CNMF au cas où la matrice des données et la matrice des archétypes sont partiellement observées. Après avoir reformulé le problème dans ce contexte de données manquantes, nous proposons un algorithme de type Majorisation-Minimisation pour l'estimation des facteurs de la décomposition puis la reconstruction des données manquantes. Une comparaison est réalisée sur des données synthétiques, mettant en évidence une amélioration des performances de reconstruction de données manquantes par rapport à la NMF classique. L'écart de performance se révèle particulièrement intéressant lorsque le bruit est important ou que le nombre de données manquantes est grand.
- Published
- 2016
36. Subjective and Objective Quality Assessment of Audio Source Separation
- Author
-
Volker Hohmann, Valentin Emiya, Niklas Harlander, Emmanuel Vincent, Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Medizinische Physik, Carl Von Ossietzky Universität Oldenburg = Carl von Ossietzky University of Oldenburg (OFFIS), French Ministry of Foreign and European Affairs, French Ministry of Higher Education and Research and German Academic Exchange Service under project Procope 20142UD, German Federal Ministry of Education and Research under project number 01EZ0741 'Model-based hearing systems', Procope 20142UD, Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, and Carl Von Ossietzky Universität Oldenburg
- Subjects
quality assessment ,Acoustics and Ultrasonics ,Computer science ,Speech recognition ,Context (language use) ,02 engineering and technology ,# Distortion measurement ,computer.software_genre ,Nonlinear distortion ,Musical acoustics ,030507 speech-language pathology & audiology ,03 medical and health sciences ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,Distortion ,0202 electrical engineering, electronic engineering, information engineering ,Source separation ,Speech ,Electrical and Electronic Engineering ,Audio signal processing ,objective measure ,Estimation theory ,020206 networking & telecommunications ,Audio ,source separation ,Noise (video) ,Noise ,0305 other medical science ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,computer ,Protocols ,subjective test protocol - Abstract
International audience; We aim to assess the perceived quality of estimated source signals in the context of audio source separation. These signals may involve one or more kinds of distortions, including distortion of the target source, interference from the other sources or musical noise artifacts. We propose a subjective test protocol to assess the perceived quality with respect to each kind of distortion and collect the scores of 20 subjects over 80 sounds. We then propose a family of objective measures aiming to predict these subjective scores based on the decomposition of the estimation error into several distortion components and on the use of the PEMO-Q perceptual salience measure to provide multiple features that are then combined. These measures increase correlation with subjective scores up to 0.5 compared to nonlinear mapping of individual state-of-the-art source separation measures. Finally, we released the data and code presented in this paper in a freely-available toolkit called PEASS.
- Published
- 2011
37. Le problème d'échantillonnage compressif avec permutation des capteurs et une solution de type branch-and-bound
- Author
-
Valentin Emiya, Antoine Bonnefoy, Laurent Daudet, Rémi Gribonval, éQuipe AppRentissage et MultimediA [Marseille] (QARMA), Laboratoire d'informatique Fondamentale de Marseille (LIF), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), Institut Langevin - Ondes et Images (UMR7587) (IL), Ecole Superieure de Physique et de Chimie Industrielles de la Ville de Paris (ESPCI Paris), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS), Parcimonie et Nouveaux Algorithmes pour le Signal et la Modélisation Audio (PANAMA), Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-SIGNAUX ET IMAGES NUMÉRIQUES, ROBOTIQUE (IRISA-D5), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS), ANR-12-BS02-0004,GRETA,GREediness: Theory and Algorithms(2012), European Project: 277906,EC:FP7:ERC,ERC-2011-StG_20101014,PLEASE(2012), Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU), Sorbonne Université (SU)-Ecole Superieure de Physique et de Chimie Industrielles de la Ville de Paris (ESPCI Paris), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Université de Paris (UP)-Centre National de la Recherche Scientifique (CNRS), SIGNAUX ET IMAGES NUMÉRIQUES, ROBOTIQUE (IRISA-D5), CentraleSupélec-Télécom Bretagne-Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National de Recherche en Informatique et en Automatique (Inria)-École normale supérieure - Rennes (ENS Rennes)-Université de Bretagne Sud (UBS)-Centre National de la Recherche Scientifique (CNRS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-CentraleSupélec-Télécom Bretagne-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Inria Rennes – Bretagne Atlantique, and Institut National de Recherche en Informatique et en Automatique (Inria)
- Subjects
[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,[INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] ,optimisation combinatoire ,traitement du signal ,branch-and-bound ,[INFO.INFO-RO]Computer Science [cs]/Operations Research [cs.RO] ,permutation ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,échantilonnage compressif - Abstract
National audience; « Lors d’un enregistrement, un ingénieur du son s’est trompé dans le câblage des nombreux microphones et s’en aperçoit bien après la séance. Peut-il retrouver le bon appariement à partir de l’enregistrement seul ? Plus généralement, peut-on retrouver automatiquement une permutation inconnue de capteurs à partir des seuls signaux enregistrés par ces capteurs ? »Nous nous intéressons à ce nouveau problème qui fait intervenir conjointement une optimisation sur l’ensemble des permutations et la modélisation de signaux numériques enregistrés par des capteurs, c’est-à-dire échantillonnés dans le temps et l’espace, selon une technique dite d’échantillonnage compressif [1, 3]. Pour ce faire, nous introduisons une méthode de type branch-and-bound dans un problème de traitement du signal, discipline qui a tendance à ne recourir que très rarement à l’optimisation combinatoire. L’ensemble de ces résultats a été présenté dans une conférence de traitement de signal [4] où le défi était d’introduire des méthodes d’optimisation combinatoire auprès d’un public peu averti et de lui montrer leur utilité dans un contexte de traitement du signal. Réciproquement, la présente proposition vise à montrer à des spécialistes d’optimisation combinatoire le potentiel inexploité d’utilisation de leurs méthodes dans des problèmes de traitement du signal, et à recueillir son intérêt et ses retours critiques.
- Published
- 2015
38. Dynamic Screening: Accelerating First-Order Algorithms for the Lasso and Group-Lasso
- Author
-
Rémi Gribonval, Antoine Bonnefoy, Valentin Emiya, Liva Ralaivola, éQuipe AppRentissage et MultimediA [Marseille] (QARMA), Laboratoire d'informatique Fondamentale de Marseille (LIF), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), Parcimonie et Nouveaux Algorithmes pour le Signal et la Modélisation Audio (PANAMA), Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-SIGNAUX ET IMAGES NUMÉRIQUES, ROBOTIQUE (IRISA-D5), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS), ANR-12-BS02-0004,GRETA,GREediness: Theory and Algorithms(2012), European Project: 277906,EC:FP7:ERC,ERC-2011-StG_20101014,PLEASE(2012), Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU), SIGNAUX ET IMAGES NUMÉRIQUES, ROBOTIQUE (IRISA-D5), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, and Institut National de Recherche en Informatique et en Automatique (Inria)
- Subjects
Dynamic screening ,Scheme (programming language) ,FOS: Computer and information sciences ,Computer science ,Screening test ,Machine Learning (stat.ML) ,Group-Lasso ,Synthetic data ,Machine Learning (cs.LG) ,Computer Science - Learning ,Lasso (statistics) ,[STAT.ML]Statistics [stat]/Machine Learning [stat.ML] ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,Statistics - Machine Learning ,Iterative Soft Thresholding ,Signal Processing ,Embedding ,Electrical and Electronic Engineering ,Lasso ,Algorithm ,computer ,Sparsity ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,computer.programming_language - Abstract
International audience; Recent computational strategies based on screening tests have been proposed to accelerate algorithms addressing penalized sparse regression problems such as the Lasso. Such approaches build upon the idea that it is worth dedicating some small computational effort to locate inactive atoms and remove them from the dictionary in a preprocessing stage so that the regression algorithm working with a smaller dictionary will then converge faster to the solution of the initial problem. We believe that there is an even more efficient way to screen the dictionary and obtain a greater acceleration: inside each iteration of the regression algorithm, one may take advantage of the algorithm computations to obtain a new screening test for free with increasing screening effects along the iterations. The dictionary is henceforth dynamically screened instead of being screened statically, once and for all, before the first iteration. We formalize this dynamic screening principle in a general algorithmic scheme and apply it by embedding inside a number of first-order algorithms adapted existing screening tests to solve the Lasso or new screening tests to solve the Group-Lasso. Computational gains are assessed in a large set of experiments on synthetic data as well as real-world sounds and images. They show both the screening efficiency and the gain in terms running times.
- Published
- 2015
39. Formalizing the Problem of Music Description
- Author
-
Sturm, Bob L., Rolf Bardeli, Thibault Langlois, Valentin Emiya, Department of Architecture and Design [Aalborg], Aalborg University [Denmark] (AAU), Fraunhofer Institute for Intelligent Analysis and Information Systems (Fraunhofer IAIS), Fraunhofer (Fraunhofer-Gesellschaft), Department of Informatics [Lisbon], Universidade de Lisboa (ULISBOA), éQuipe AppRentissage et MultimediA [Marseille] (QARMA), Laboratoire d'informatique Fondamentale de Marseille (LIF), Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU), Institut Francais du Danemark, ANR-11-LABX-0033,ARCHIMEDE,ARCHIMEDE / Mathématiques(2011), Universidade de Lisboa = University of Lisbon (ULISBOA), and Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,[INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG] ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing - Abstract
International audience; The lack of a formalism for “the problem of music description” results in, among other things: ambiguity in what problem a music description system must address, how it should be evaluated, what criteria define its success, and the paradox that a music description system can reproduce the “ground truth” of a music dataset without attending to the music it contains. To address these issues, we formalize the problem of music description such that all elements of an instance of it are made explicit. This can thus inform the building of a system, and how it should be evaluated in a meaningful way. We provide illustrations of this formalism applied to three examples drawn from the literature.
- Published
- 2015
40. Compressed sensing with unknown sensor permutation
- Author
-
Antoine Bonnefoy, Valentin Emiya, Rémi Gribonval, Laurent Daudet, éQuipe AppRentissage et MultimediA [Marseille] (QARMA), Laboratoire d'informatique Fondamentale de Marseille (LIF), Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU), Institut Langevin - Ondes et Images (UMR7587) (IL), Sorbonne Université (SU)-Ecole Superieure de Physique et de Chimie Industrielles de la Ville de Paris (ESPCI Paris), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Université de Paris (UP)-Centre National de la Recherche Scientifique (CNRS), Parcimonie et Nouveaux Algorithmes pour le Signal et la Modélisation Audio (PANAMA), SIGNAUX ET IMAGES NUMÉRIQUES, ROBOTIQUE (IRISA-D5), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), CentraleSupélec-Télécom Bretagne-Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National de Recherche en Informatique et en Automatique (Inria)-École normale supérieure - Rennes (ENS Rennes)-Université de Bretagne Sud (UBS)-Centre National de la Recherche Scientifique (CNRS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-CentraleSupélec-Télécom Bretagne-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), ANR-12-BS02-0004,GRETA,GREediness: Theory and Algorithms(2012), European Project: 277906,EC:FP7:ERC,ERC-2011-StG_20101014,PLEASE(2012), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), Ecole Superieure de Physique et de Chimie Industrielles de la Ville de Paris (ESPCI Paris), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS), Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-SIGNAUX ET IMAGES NUMÉRIQUES, ROBOTIQUE (IRISA-D5), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), and Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)
- Subjects
Signal processing ,Mathematical optimization ,0211 other engineering and technologies ,02 engineering and technology ,permutation ,Set (abstract data type) ,Permutation ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,branch and bound ,0202 electrical engineering, electronic engineering, information engineering ,Almost surely ,Time complexity ,Mathematics ,compressed sensing ,021103 operations research ,Branch and bound ,sparsity ,020206 networking & telecommunications ,Inverse problem ,Compressed sensing ,inverse problem ,dictionary learning ,Algorithm ,optimization ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing - Abstract
International audience; Compressed sensing is the ability to retrieve a sparse vector from a set of linear measurements. The task gets more difficult when the sensing process is not perfectly known. We address such a problem in the case where the sensors have been permuted, i.e., the order of the measurements is unknown. We propose a branch-and-bound algorithm that converges to the solution. The experimental study shows that our approach always retrieves the unknown permutation, while a simple convex relaxation strategy almost always fails. In terms of its time complexity, we show that the proposed algorithm converges quickly with respect to the combinatorial nature of the problem.
- Published
- 2014
- Full Text
- View/download PDF
41. Sparse underwater acoustic imaging: a case study
- Author
-
Rémi Gribonval, Valentin Emiya, Nancy Bertin, Nikolaos Stefanakis, Pierre Cervenka, Jacques Marchal, Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Institut Jean le Rond d'Alembert (DALEMBERT), Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), éQuipe AppRentissage et MultimediA [Marseille] (QARMA), Laboratoire d'informatique Fondamentale de Marseille (LIF), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Marseille (ECM)-Aix Marseille Université (AMU), Stefanakis, Nikolaos, and Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC)
- Subjects
Beamforming ,Computer science ,[INFO.INFO-TS] Computer Science [cs]/Signal and Image Processing ,orthogonal matching pursuit ,Context (language use) ,02 engineering and technology ,Sonar ,beamforming ,Computer Science::Robotics ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,0202 electrical engineering, electronic engineering, information engineering ,Computer vision ,14. Life underwater ,Underwater ,[SPI.SIGNAL] Engineering Sciences [physics]/Signal and Image processing ,compressed sensing ,business.industry ,020206 networking & telecommunications ,020207 software engineering ,Matching pursuit ,sparse reconstruction ,Compressed sensing ,Transducer ,Computer Science::Computer Vision and Pattern Recognition ,sonar imaging. underwater acoustics ,Artificial intelligence ,Underwater acoustics ,business ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,Optoacoustic imaging - Abstract
International audience; Underwater acoustic imaging is traditionally performed with beam- forming: beams are formed at emission to insonify limited angular regions; beams are (synthetically) formed at reception to form the image. We propose to exploit a natural sparsity prior to perform 3D underwater imaging using a newly built flexible-configuration sonar device. The computational challenges raised by the high- dimensionality of the problem are highlighted, and we describe a strategy to overcome them. As a proof of concept, the proposed approach is used on real data acquired with the new sonar to obtain an image of an underwater target. We discuss the merits of the obtained image in comparison with standard beamforming, as well as the main challenges lying ahead, and the bottlenecks that will need to be solved before sparse methods can be fully exploited in the context of underwater compressed 3D sonar imaging.
- Published
- 2012
42. Audio Inpainting
- Author
-
Maria G. Jafari, Valentin Emiya, Rémi Gribonval, Michael Elad, Amir Adler, Mark D. Plumbley, Department of Computer Science [Haifa], University of Haifa [Haifa], Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Centre for Digital Music, Queen Mary University of London (QMUL), European Project: 225913,EC:FP7:ICT,FP7-ICT-2007-C,SMALL(2009), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), and Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique
- Subjects
Acoustics and Ultrasonics ,Sample rate conversion ,business.industry ,Inpainting ,020206 networking & telecommunications ,Pattern recognition ,02 engineering and technology ,Sparse approximation ,computer.software_genre ,Matching pursuit ,Noise ,Clipping (photography) ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,Audio normalization ,Computer Science::Sound ,Computer Science::Multimedia ,0202 electrical engineering, electronic engineering, information engineering ,020201 artificial intelligence & image processing ,Artificial intelligence ,Electrical and Electronic Engineering ,business ,Audio signal processing ,computer ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,Mathematics - Abstract
We propose the audio inpainting framework that recovers portions of audio data distorted due to impairments such as impulsive noise, clipping, and packet loss. In this framework, the distorted data are treated as missing and their location is assumed to be known. The signal is decomposed into overlapping time-domain frames and the restoration problem is then formulated as an inverse problem per audio frame. Sparse representation modeling is employed per frame, and each inverse problem is solved using the Orthogonal Matching Pursuit algorithm together with a discrete cosine or a Gabor dictionary. The Signal-to-Noise Ratio performance of this algorithm is shown to be comparable or better than state-of-the-art methods when blocks of samples of variable durations are missing. We also demonstrate that the size of the block of missing samples, rather than the overall number of missing samples, is a crucial parameter for high quality signal restoration. We further introduce a constrained Matching Pursuit approach for the special case of audio declipping that exploits the sign pattern of clipped audio samples and their maximal absolute value, as well as allowing the user to specify the maximum amplitude of the signal. This approach is shown to outperform state-of-the-art and commercially available methods for audio declipping in terms of Signal-to-Noise Ratio.
- Published
- 2012
43. Sparse reconstruction techniques for near-field underwater acoustic imaging
- Author
-
Nikolaos Stefanakis, Jacques Marchal, Valentin Emiya, Nancy Bertin, Rémi Gribonval, Pierre Cervenka, System, HAL, Société Française d'Acoustique, Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Institut Jean le Rond d'Alembert (DALEMBERT), Centre National de la Recherche Scientifique (CNRS)-Université Pierre et Marie Curie - Paris 6 (UPMC), Laboratoire d'informatique Fondamentale de Marseille - UMR 6166 (LIF), Université de la Méditerranée - Aix-Marseille 2-Université de Provence - Aix-Marseille 1-Centre National de la Recherche Scientifique (CNRS), Parcimonie et Nouveaux Algorithmes pour le Signal et la Modélisation Audio (PANAMA), Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-SIGNAUX ET IMAGES NUMÉRIQUES, ROBOTIQUE (IRISA-D5), CentraleSupélec-Télécom Bretagne-Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National de Recherche en Informatique et en Automatique (Inria)-École normale supérieure - Rennes (ENS Rennes)-Université de Bretagne Sud (UBS)-Centre National de la Recherche Scientifique (CNRS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-CentraleSupélec-Télécom Bretagne-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-École normale supérieure - Rennes (ENS Rennes)-Université de Bretagne Sud (UBS)-Centre National de la Recherche Scientifique (CNRS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Université Pierre et Marie Curie - Paris 6 (UPMC)-Centre National de la Recherche Scientifique (CNRS), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), and Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Télécom Bretagne-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)
- Subjects
[SPI.ACOU]Engineering Sciences [physics]/Acoustics [physics.class-ph] ,[SPI.ACOU] Engineering Sciences [physics]/Acoustics [physics.class-ph] ,orthogonal matching pursuit ,underwater imaging ,[PHYS.MECA.ACOU] Physics [physics]/Mechanics [physics]/Acoustics [physics.class-ph] ,sparse reconstruction ,[PHYS.MECA.ACOU]Physics [physics]/Mechanics [physics]/Acoustics [physics.class-ph] ,compressed sensing - Abstract
International audience; The use of sparse priors has shown interesting potential in various acoustic or radar imaging applications. In this paper, sparse reconstruction is applied for underwater acoustic imaging using a newly built flexible sonar device. We investigate several models concerning the linear mapping between the image domain and the observation domain. In particular, we define a point-scatterer model in which the apparent back-scatter coefficient of a given reflector varies with respect to the specific emitter and receiver locations. To handle this problem, we adapt a multi-channel version of the orthogonal matching pursuit and we apply it on real data in order to obtain images of an underwater target placed at a small distance from the sonar. The techniques are shown to overcome bottlenecks that are apparent with more standard approaches that assume far-field conditions when building the image.
- Published
- 2012
44. A Reproducible Research Framework for Audio Inpainting
- Author
-
Amir Adler, Valentin Emiya, Maria Jafari, Michael Elad, Rémi Gribonval, Plumbley, Mark D., Department of Computer Science [Haifa], University of Haifa [Haifa], Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Centre for Digital Music, Queen Mary University of London (QMUL), European Project: 225913,EC:FP7:ICT,FP7-ICT-2007-C,SMALL(2009), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), and Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique
- Subjects
[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,audio inpainting ,ComputingMethodologies_IMAGEPROCESSINGANDCOMPUTERVISION ,sparse representation ,reproducible research ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing - Abstract
International audience; We introduce a unified framework for the restoration of distorted audio data, leveraging the Image Inpainting concept and covering existing audio applications. In this framework, termed Audio Inpainting, the distorted data is considered missing and its location is assumed to be known. We further introduce baseline approaches based on sparse representations. For this new audio inpainting concept, we provide reproducible-research tools including: the handling of audio inpainting tasks as inverse problems, embedded in a frame-based scheme similar to patch-based image processing; several experimental settings; speech and music material; OMP-like algorithms, with two dictionaries, for general audio inpainting or specifically-enhanced declipping.
- Published
- 2011
45. A Constrained Matching Pursuit Approach to Audio Declipping
- Author
-
Valentin Emiya, Amir Adler, Rémi Gribonval, Michael Elad, Maria G. Jafari, Mark D. Plumbley, Department of Computer Science [Haifa], University of Haifa [Haifa], Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Centre for Digital Music, Queen Mary University of London (QMUL), Israel Science Foundation grant no. 1031/08, European Project: 225913,EC:FP7:ICT,FP7-ICT-2007-C,SMALL(2009), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), and Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique
- Subjects
Clipping (audio) ,Audio signal ,Computer science ,business.industry ,Inpainting ,020206 networking & telecommunications ,Pattern recognition ,02 engineering and technology ,Sparse approximation ,computer.software_genre ,Matching pursuit ,Signal-to-noise ratio ,Clipping (photography) ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,Computer Science::Sound ,Computer Science::Multimedia ,0202 electrical engineering, electronic engineering, information engineering ,020201 artificial intelligence & image processing ,Artificial intelligence ,Audio signal processing ,business ,computer ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,Image restoration - Abstract
International audience; We present a novel sparse representation based approach for the restoration of clipped audio signals. In the proposed approach, the clipped signal is decomposed into overlapping frames and the declipping problem is formulated as an inverse problem, per audio frame. This problem is further solved by a constrained matching pursuit algorithm, that exploits the sign pattern of the clipped samples and their maximal absolute value. Performance evaluation with a collection of music and speech signals demonstrate superior results compared to existing algorithms, over a wide range of clipping levels.
- Published
- 2011
46. Multipitch estimation of piano sounds using a new probabilistic spectral smoothness principle
- Author
-
Bertrand David, Roland Badeau, Valentin Emiya, Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Laboratoire Traitement et Communication de l'Information (LTCI), Télécom ParisTech-Institut Mines-Télécom [Paris] (IMT)-Centre National de la Recherche Scientifique (CNRS), ANR-06-JCJC-0027,DESAM,Décomposition en Eléments Sonores et Applications Musicales(2006), European Project: 33502,K-SPACE, Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), and Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique
- Subjects
Acoustics and Ultrasonics ,Speech recognition ,Musical instrument ,02 engineering and technology ,Background noise ,Physics::Popular Physics ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,0202 electrical engineering, electronic engineering, information engineering ,Electrical and Electronic Engineering ,Mathematics ,Transcription (music) ,Piano ,spectral smoothness ,multipitch estimation ,020206 networking & telecommunications ,piano ,audio processing ,Moving-average model ,Sound recording and reproduction ,Autoregressive model ,Spectral envelope ,Computer Science::Sound ,020201 artificial intelligence & image processing ,Acoustic signal analysis ,transcription ,Algorithm ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing - Abstract
International audience; A new method for the estimation of multiple concurrent pitches in piano recordings is presented. It addresses the issue of overlapping overtones by modeling the spectral envelope of the overtones of each note with a smooth autoregressive model. For the background noise, a moving-average model is used and the combination of both tends to eliminate harmonic and sub-harmonic erroneous pitch estimations. This leads to a complete generative spectral model for simultaneous piano notes, which also explicitly includes the typical deviation from exact harmonicity in a piano overtone series. The pitch set which maximizes an approximate likelihood is selected from among a restricted number of possible pitch combinations as the one. Tests have been conducted on a large homemade database called MAPS, composed of piano recordings from a real upright piano and from high-quality samples.
- Published
- 2010
47. Subjective and objective quality assessment of audio source separation
- Author
-
Valentin Emiya, Emmanuel Vincent, Niklas Harlander, Volker Hohmann, Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Medizinische Physik, Carl Von Ossietzky Universität Oldenburg, French Ministry of Foreign and European Affairs, French Ministry of Higher Education and Research and German Academic Exchange Service under project Procope 20142UD, German Federal Ministry of Education and Research under project number 01EZ0741 ``Model-based hearing systems', PHC Procope 20142UD, Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, and Carl Von Ossietzky Universität Oldenburg = Carl von Ossietzky University of Oldenburg (OFFIS)
- Subjects
quality assessment ,objective measure ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,audio ,Source separation ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,subjective test protocol - Abstract
La version 4 de ce document correspond à une rétractation, pour raisons scientifiques (contenu obsolète par rapport à la publication HAL inria-00567152). Le fichier pdf reste disponible dans la version 3.; We aim to assess the perceived quality of estimated source signals in the context of audio source separation. These signals may involve one or more kinds of distortions, including distortion of the target source, interference from the other sources or musical noise artifacts. We propose a subjective test protocol to assess the perceived quality with respect to each kind of distortion and collect the scores of 20 subjects over 80 sounds. We then propose a family of objective measures aiming to predict these subjective scores based on the decomposition of the estimation error into several distortion components and on the use of the PEMO-Q perceptual salience measure. These measures increase correlation with subjective scores up to 0.5 compared to nonlinear mapping of individual state-of-the-art source separation measures.; Cette étude porte sur la qualité perceptive des signaux des sources estimés dans le cadre de la séparation de sources audio. Ces signaux peuvent présenter plusieurs types de distortions, notamment la distortion de la source cible, les interférences liées aux autres sources et les artefacts de type bruit musical. Nous proposons un protocole de test subjectif pour établir la qualité liée à la perception de chaque type de distortion. L'évaluation de 80 sons par 20 sujets a ainsi été réalisée. Nous proposons ensuite un ensemble de mesures objectives permettant de prédire ces critères de qualité via une décomposition de l'erreur d'estimation en plusieurs composantes de distortion et via l'utilisation de la mesure de qualité perceptive PEMO-Q. Par rapport aux mesures de l'état de l'art, la corrélation entre ces mesures et les notes subjectives est meilleure, avec un gain pouvant atteindre 0,5.
- Published
- 2010
48. Multi-criteria subjective and objective evaluation of audio source separation
- Author
-
Valentin Emiya, Emmanuel Vincent, Niklas Harlander, Volker Hohmann, Emiya, Valentin, Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Medizinische Physik, Carl Von Ossietzky Universität Oldenburg = Carl von Ossietzky University of Oldenburg (OFFIS), French Ministry of Foreign and European Affairs, French Ministry of Higher Education and Research and German Academic Exchange Service under project Procope 20142UD, German Federal Ministry of Education and Research under project number 01EZ0741 ``Model-based hearing systems', PHC Procope 20142UD, Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, and Carl Von Ossietzky Universität Oldenburg
- Subjects
[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,[INFO.INFO-TS] Computer Science [cs]/Signal and Image Processing ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,[SPI.SIGNAL] Engineering Sciences [physics]/Signal and Image processing - Abstract
International audience; In this paper, we address the problem of assessing the perceived quality of estimated source signals in the context of audio source separation. These signals involve different kinds of distortions depending on the considered separation algorithm, including distortion of the target source, interference from other sources or musical noise artifacts. A new MUSHRA-based subjective test protocol is proposed to assess the perceived quality with respect to each kind of distortion and collect the scores of 20 subjects over 80 sounds. Subsequently, the contribution of each type of distortion to the overall quality is analyzed. We propose a family of objective measures aiming to predict the subjective scores based on a decomposition of the estimation error into several distortion components. We conclude by discussing possible implications of this work in the field of 3D audio quality assessment.
- Published
- 2010
49. An investigation of discrete-state discriminant approaches to single-sensor source separation
- Author
-
Rémi Gribonval, Emmanuel Vincent, Valentin Emiya, Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), and Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique
- Subjects
Computer science ,02 engineering and technology ,010501 environmental sciences ,01 natural sciences ,Set (abstract data type) ,symbols.namesake ,[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,0202 electrical engineering, electronic engineering, information engineering ,Source separation ,Gaussian process ,0105 earth and related environmental sciences ,business.industry ,020206 networking & telecommunications ,Pattern recognition ,State (functional analysis) ,Mixture model ,single sensor ,Time–frequency analysis ,Discriminant ,Audio ,source separation ,symbols ,Artificial intelligence ,business ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing ,Decoding methods - Abstract
International audience; This paper investigated a new scheme for single-sensor audio source separation. This framework is introduced comparatively to the existing Gaussian mixture model generative approach and is focusing on the mixture states rather than on the source states, resulting in a discrete, joint state discriminant approach. The study establishes the theoretical performance bounds of the proposed scheme and an actual source separation system is designed. The performance is computed on a set of musical recordings and a discussion is proposed, including the question of the source correlation and the possible drawbacks of the method.
- Published
- 2009
50. Estimateurs oracles pour la séparation de sources monocapteur par approches spectrales à états discrets
- Author
-
Valentin Emiya, Emmanuel Vincent, Rémi Gribonval, Speech and sound data modeling and processing (METISS), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), and Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Rennes – Bretagne Atlantique
- Subjects
[INFO.INFO-TS]Computer Science [cs]/Signal and Image Processing ,[SPI.SIGNAL]Engineering Sciences [physics]/Signal and Image processing - Abstract
National audience; Dans cet article, des bornes de performances oracles sont déterminées pour la séparation de sources monocapteur sous contrainte d'un nombre fini d'états discrets. En fixant des contraintes qui sont à la base de systèmes existants, les bornes de performances obtenues sont plus réalistes qu'avec une contrainte de masquage temps-fréquence seule. Dans ce contexte, l'efficacité théorique des approches par mélanges de gaussiennes est quantifiée et comparée à des résultats provenant d'un système de l'état de l'art. De futures approches sont envisagées en faisant évoluer ces modèles vers des méthodes discriminantes à états conjoints
- Published
- 2009
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.