Back to Search Start Over

Block-Coordinate Frank-Wolfe Optimization for Structural SVMs

Authors :
Lacoste-Julien, Simon
Jaggi, Martin
Schmidt, Mark
Pletscher, Patrick
Statistical Machine Learning and Parsimony (SIERRA)
Département d'informatique - ENS Paris (DI-ENS)
Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Inria Paris-Rocquencourt
Institut National de Recherche en Informatique et en Automatique (Inria)
Centre de Mathématiques Appliquées - Ecole Polytechnique (CMAP)
École polytechnique (X)-Centre National de la Recherche Scientifique (CNRS)
Machine Learning Laboratory
Lacoste-Julien, Simon
Département d'informatique de l'École normale supérieure (DI-ENS)
École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Paris-Rocquencourt
École normale supérieure - Paris (ENS-PSL)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure - Paris (ENS-PSL)
Source :
ICML 2013 International Conference on Machine Learning, ICML 2013 International Conference on Machine Learning, Jun 2013, Atlanta, United States. pp.53-61
Publication Year :
2013
Publisher :
HAL CCSD, 2013.

Abstract

We propose a randomized block-coordinate variant of the classic Frank-Wolfe algorithm for convex optimization with block-separable constraints. Despite its lower iteration cost, we show that it achieves a similar convergence rate in duality gap as the full Frank-Wolfe algorithm. We also show that, when applied to the dual structural support vector machine (SVM) objective, this yields an online algorithm that has the same low iteration complexity as primal stochastic subgradient methods. However, unlike stochastic subgradient methods, the block-coordinate Frank-Wolfe algorithm allows us to compute the optimal step-size and yields a computable duality gap guarantee. Our experiments indicate that this simple algorithm outperforms competing structural SVM solvers.<br />Appears in Proceedings of the 30th International Conference on Machine Learning (ICML 2013). 9 pages main text + 22 pages appendix. Changes from v3 to v4: 1) Re-organized appendix; improved & clarified duality gap proofs; re-drew all plots; 2) Changed convention for Cf definition; 3) Added weighted averaging experiments + convergence results; 4) Clarified main text and relationship with appendix

Details

Language :
English
Database :
OpenAIRE
Journal :
ICML 2013 International Conference on Machine Learning, ICML 2013 International Conference on Machine Learning, Jun 2013, Atlanta, United States. pp.53-61
Accession number :
edsair.doi.dedup.....efcd1ffc0e3627c5a095538ec7101a69