Back to Search Start Over

S-LIME : reconcilier localité et fidélité des explications linéaires

Authors :
Gaudel, Romaric
Galárraga, Luis
Delaunay, Julien
Roze, Laurence
Bhargava, Vaishnavi
Ecole Nationale de la Statistique et de l'Analyse de l'Information [Bruz] (ENSAI)
Centre de Recherche en Economie et Statistique [Bruz] (CREST)
Large Scale Collaborative Data Mining (LACODAM)
Inria Rennes – Bretagne Atlantique
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-GESTION DES DONNÉES ET DE LA CONNAISSANCE (IRISA-D7)
Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA)
Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique)
Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)
Institut National des Sciences Appliquées - Rennes (INSA Rennes)
Institut National des Sciences Appliquées (INSA)
Birla Institute of Technology and Science (BITS Pilani)
Inria Project Lab 'Hybrid Approaches for Interpretable AI' (HyAIAI)
ANR-19-CE23-0019,FAbLe,Framework for Automatic Interpretability in Machine Learning(2019)
European Project: 952215,TAILOR(2020)
Source :
CAP-RFIAP 2022-Conférence française sur l'apprentissage machine-Reconnaissance de formes, Images, Apprentissage et Perception, CAP-RFIAP 2022-Conférence française sur l'apprentissage machine-Reconnaissance de formes, Images, Apprentissage et Perception, Jul 2022, Vannes, France
Publication Year :
2022
Publisher :
HAL CCSD, 2022.

Abstract

International audience; L’avantage de la localité est l’une des principales prémisses de LIME, l’une des méthodes les plus importantes pour expliquer les modèles d’apprentissage automatique de type boîte noire. Cet angle d’attaque repose sur le postulat que plus nous exa- minons localement le voisinage d’une instance, plus le modèle de boîte noire devient simple et plus nous pouvons l’imiter avec précision à l’aide d’un substitut linéaire. Aussi logique que cela puisse paraître, nos résultats suggèrent que, avec la conception actuelle de LIME, le modèle de substitution peut dégénérer lorsque l’explication est trop locale, c’est-à-dire lorsque le paramètre de largeur de bande σ tend vers zéro. Sur la base de cette observation, la contribution de cet article est double. Premièrement, nous étudions l’impact de la bande passante et du voisinage d’apprentissage sur la fidélité et la sémantique des explications LIME. Deuxièmement, et sur la base de nos résultats, nous proposons S-LIME, une extension de LIME qui réconcilie fidélité et localité.

Details

Language :
French
Database :
OpenAIRE
Journal :
CAP-RFIAP 2022-Conférence française sur l'apprentissage machine-Reconnaissance de formes, Images, Apprentissage et Perception, CAP-RFIAP 2022-Conférence française sur l'apprentissage machine-Reconnaissance de formes, Images, Apprentissage et Perception, Jul 2022, Vannes, France
Accession number :
edsair.dedup.wf.001..f682fd42edbbb69eda2c9b549fb88398