Back to Search Start Over

Asteroid: the PyTorch-based audio source separation toolkit for researchers

Authors :
Ariel Frank
Emmanuel Vincent
Fabian-Robert Stöter
Mathieu Hu
Joris Cosentino
Manuel Pariente
Samuele Cornell
Sunit Sivasankaran
David Ditter
Efthymios Tzinis
Juan M. Martín-Doñas
Antoine Deleforge
Michel Olvera
Jens Heitkaemper
Speech Modeling for Facilitating Oral-Based Communication (MULTISPEECH)
Inria Nancy - Grand Est
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Department of Natural Language Processing & Knowledge Discovery (LORIA - NLPKD)
Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)
Università Politecnica delle Marche [Ancona] (UNIVPM)
Department of Electrical and Computer Engineering [Urbana] (University of Illinois)
University of Illinois at Urbana-Champaign [Urbana]
University of Illinois System-University of Illinois System
University of Paderborn
Scientific Data Management (ZENITH)
Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier (LIRMM)
Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Inria Sophia Antipolis - Méditerranée (CRISAM)
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)
Universidad de Granada = University of Granada (UGR)
University of Hamburg
Technion - Israel Institute of Technology [Haifa]
Grid'5000
Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)
Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Inria Sophia Antipolis - Méditerranée (CRISAM)
University of Granada [Granada]
Source :
Interspeech 2020, Interspeech 2020, Oct 2020, Shanghai, China, INTERSPEECH
Publication Year :
2020
Publisher :
HAL CCSD, 2020.

Abstract

This paper describes Asteroid, the PyTorch-based audio source separation toolkit for researchers. Inspired by the most successful neural source separation systems, it provides all neural building blocks required to build such a system. To improve reproducibility, Kaldi-style recipes on common audio source separation datasets are also provided. This paper describes the software architecture of Asteroid and its most important features. By showing experimental results obtained with Asteroid's recipes, we show that our implementations are at least on par with most results reported in reference papers. The toolkit is publicly available at https://github.com/mpariente/asteroid .<br />Submitted to Interspeech 2020

Details

Language :
English
Database :
OpenAIRE
Journal :
Interspeech 2020, Interspeech 2020, Oct 2020, Shanghai, China, INTERSPEECH
Accession number :
edsair.doi.dedup.....c7bd860f867da876db8feffc5d8aa9bd