Les robots ont besoin de vraie physique, pas juste de beaux pixels

// IA7 · 01/06/26 - 08:30

// illustration générée — IA7

Les modèles du monde actuels pour robots apprennent à prédire ce qu'ils voient — mais pas forcément comment les choses fonctionnent vraiment. Résultat : un robot peut « voir » une action logique et la recommander alors qu'elle est physiquement impossible. Des chercheurs exposent le piège avec des benchmarks où deux scènes visuellement identiques cachent deux physiques différentes. Le robot prédit bien l'observation suivante dans les deux cas, mais échoue quand il doit agir : il confond ressemblance et causalité. C'est crucial pour les robots d'usine ou les systèmes autonomes — un modèle qui « hallucine » la physique peut causer des dégâts coûteux ou des accidents. La solution ? Construire des modèles qui comprennent la structure physique sous-jacente, pas seulement l'apparence des choses.

-- glossaire

World model

— Représentation interne qu'un système IA construit pour prédire les conséquences de ses actions dans l'environnement physique.

Observation-predictive

— Modèle entraîné à prédire uniquement la prochaine image ou observation sensorielle, sans modéliser les lois physiques sous-jacentes.

Query-conditioned

— Modèle capable de répondre à des questions hypothétiques (« que se passe-t-il si je fais ça ? ») plutôt que de simples prédictions linéaires.

[SOURCE] ArXiv AI

// IA7 — L'IA. En clair. Maintenant.