Back to Search Start Over

Interpolating between Optimal Transport and MMD using Sinkhorn Divergences

Authors :
Feydy, Jean
Séjourné, Thibault
Vialard, François-Xavier
Amari, Shun-ichi
Trouvé, Alain
Peyré, Gabriel
Centre de Mathématiques et de Leurs Applications (CMLA)
École normale supérieure - Cachan (ENS Cachan)-Centre National de la Recherche Scientifique (CNRS)
Département de Mathématiques et Applications - ENS Paris (DMA)
École normale supérieure - Paris (ENS-PSL)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)
Université Paris Dauphine-PSL
Université Paris sciences et lettres (PSL)
Méthodes numériques pour le problème de Monge-Kantorovich et Applications en sciences sociales (MOKAPLAN)
CEntre de REcherches en MAthématiques de la DEcision (CEREMADE)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Université Paris Dauphine-PSL
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Inria de Paris
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)
Université Paris-Est Marne-la-Vallée (UPEM)
RIKEN Center for Brain Science [Wako] (RIKEN CBS)
RIKEN - Institute of Physical and Chemical Research [Japon] (RIKEN)
École normale supérieure - Paris (ENS Paris)
Inria de Paris
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-CEntre de REcherches en MAthématiques de la DEcision (CEREMADE)
Centre National de la Recherche Scientifique (CNRS)-Université Paris Dauphine-PSL
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)
Centre National de la Recherche Scientifique (CNRS)-École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Inria de Paris
Publication Year :
2018
Publisher :
HAL CCSD, 2018.

Abstract

Comparing probability distributions is a fundamental problem in data sciences. Simple norms and divergences such as the total variation and the relative entropy only compare densities in a point-wise manner and fail to capture the geometric nature of the problem. In sharp contrast, Maximum Mean Discrepancies (MMD) and Optimal Transport distances (OT) are two classes of distances between measures that take into account the geometry of the underlying space and metrize the convergence in law. This paper studies the Sinkhorn divergences, a family of geometric divergences that interpolates between MMD and OT. Relying on a new notion of geometric entropy, we provide theoretical guarantees for these divergences: positivity, convexity and metrization of the convergence in law. On the practical side, we detail a numerical scheme that enables the large scale application of these divergences for machine learning: on the GPU, gradients of the Sinkhorn loss can be computed for batches of a million samples.<br />15 pages, 5 figures

Details

Language :
English
Database :
OpenAIRE
Accession number :
edsair.doi.dedup.....87b5fce301abdb2dc7f746021a435a3f