Pourquoi expliquer les LLM reste philosophiquement impossible

// IA7 · 16/06/26 - 12:31

Hans Olo16/06/26 - 12:31·3 min·actu·ArXiv AI

Pourquoi expliquer les LLM reste philosophiquement impossible

// illustration générée — IA7

0:00 / 0:00

Des chercheurs d'arXiv proposent une définition formelle de ce qu'est une bonne explication en IA, inspirée par les explications contrefactuelles. Le modèle intègre les croyances préalables de l'interlocuteur : expliquer n'est pas donner des faits, mais adapter l'information à ce que sait déjà celui qui écoute.

Le problème central : les LLM génèrent des réponses via des milliards de paramètres interconnectés, sans véritable « raison » à exposer. Contrairement à un diagnostic médical (« vous avez la grippe car vous avez 39°C, toux, fatigue »), il n'existe pas de chaîne causale claire à raconter.

Cette approche philosophique redéfinit l'explainability comme un acte relationnel, pas comme une dissection technique. Elle remet en question la course actuelle aux outils d'interprétabilité (attention maps, feature visualizations) : ils décortiquent le fonctionnement interne, mais ne constituent pas des explications au sens où l'entend un humain.

Implication : l'IA adoptée massivement sans véritable compréhension. Les utilisateurs obtiennent des réponses convaincantes, jamais des explications. Une distinction qui change tout pour la confiance et la responsabilité.

// à savoir

Explications contrefactuelles

— Méthode explicative basée sur le « et si » : « la décision aurait été différente si ce paramètre avait changé ». Ex : « on vous a refusé le prêt ; avec un revenu 20% plus haut, vous l'auriez eu ».

Interprétabilité vs Explainabilité

— Interprétabilité = comprendre comment fonctionne le modèle (ingénierie). Explainabilité = raconter à un humain pourquoi il a pris cette décision (philosophie, contexte social).

source

/ feed ↩

Pourquoi expliquer les LLM reste philosophiquement impossible

// à savoir

Explications contrefactuelles

Interprétabilité vs Explainabilité

OpenAI brûle 3,7 milliards pour en gagner 5,7

Mythos : pourquoi l'embargo cyber ne marche jamais

Les meilleurs modèles IA échouent à 97% sur le vrai travail