Partie	Question traitée	Données	Outil principal
Partie 1	Jusqu'où l'interprétabilité classique peut nous mener ?	Census (tabulaire)	Arbre, coefficients, ACP, SHAP
Partie 2	La même logique tient-elle sur texte et multi-classes ?	Émotions (texte)	SHAP multi-classes
Partie 3	Pouvez-vous mener le workflow seul·e ?	Votre dataset	Analyse SHAP autonome

Modèle	Score F1	Interprétabilité
Arbre de décision (profondeur 3)	~0.75	Règles lisibles
Régression logistique	~0.78	Coefficients directement inspectables
XGBoost	~0.81	Non inspectable directement

Le workflow

Quatre étapes pour appliquer SHAP

Entraîner votre modèle

N'importe quel modèle — mais les boosters d'arbres (XGBoost, LightGBM) vont avec un TreeExplainer rapide.

Créer l'explainer

explainer = shap.TreeExplainer(xgb_model, data=X_train, model_output="probability") · data=X_train sert de jeu de fond — c'est sur lui qu'on calcule la prédiction moyenne (= expected value).

Calculer les valeurs SHAP

shap_values = explainer.shap_values(X_test) → une matrice (n_samples, n_features)

Visualiser & interpréter

Bar · beeswarm · dependence · force — nous allons lire les quatre.

Précaution	Ce que cela veut dire
Variables corrélées	Le crédit peut se répartir entre jumelles de manière floue
Coût de calcul	`TreeExplainer` est rapide — d'autres explainers peuvent être lents
Pas la causalité	Une forte valeur SHAP est une association, pas une cause
Instabilité locale	Des individus similaires → explications parfois différentes
Choix de l'explainer	Différents explainers se comportent différemment selon les modèles

Aspect	Partie 1 (binaire)	Partie 3 (multi-classes texte)
Variables	Colonnes tabulaires	Mots / tokens
Tâche	Binaire	6 classes (tristesse · joie · peur · colère · surprise · dégoût)
Espace SHAP	Probabilités	Logits (scores bruts)
Unité d'explication	Une par prédiction	Une par classe, par prédiction

Parcours : Data Scientist

Interprétabilité

des modèles avec SHAP

Ouvrir la boîte noire — comprendre pourquoi votre modèle prédit ce qu'il prédit

À propos de cette masterclass

Ce que vous allez apprendre

Le problème

Un modèle à 98% peut se tromper

Pourquoi ça compte

Quatre raisons d'ouvrir la boîte noire

Feuille de route

Notre parcours en trois parties

Partie 1

Des modèles simples

à la boîte noire

Données tabulaires · Prédiction de revenus

Le jeu de données

Prédire les revenus du Census US

Interprétable par nature · 1

Lire un arbre de décision

Interprétable par nature · 2

Ce que l'arbre dit (et ne dit pas)

Interprétable par nature · 3

Feature importance & coefficients

Interprétable par nature · 4

Biplot ACP — une carte globale

Le compromis

Performance vs. interprétabilité

Partie 2

SHAP

à la rescousse

Un langage unifié pour tout modèle

L'idée centrale

SHAP en une image mentale

La fondation

Pourquoi SHAP est fiable

Le workflow

Quatre étapes pour appliquer SHAP

Structure de sortie

La matrice des valeurs SHAP

La ligne de base

Expected value = prédiction moyenne

Vue globale · 1

Le bar plot — ce qui compte en moyenne

Vue globale · 2

Le beeswarm — comment et pour qui

Vue locale · 1

Le dependence plot — comment une variable se comporte

Vue locale · 2

Le force plot — une décision précise

Connaître les limites

SHAP est puissant — pas magique

Partie 3

SHAP sur texte

et multi-classes

Classification d'émotions à 6 classes

Ce qui change

Du tabulaire au texte, de 2 à 6 classes

Nouveau concept · 1

Logits vs. probabilités

Nouveau concept · 2

Une explication par classe

Lire les force plots multi-classes

Quels mots déclenchent chaque émotion ?

Dernière Partie

À votre tour maintenant

Appliquez le workflow SHAP complet sur vos données

Défi ouvert

Votre workflow SHAP en 5 étapes

Synthèse

À retenir

Quiz · Vérifiez votre compréhension

Que signifie une valeur SHAP positive ?

Pour aller plus loin

Ressources recommandées

Masterclass terminée

Merci !

Des questions ? Échangeons.