Les modèles du monde actuels pour robots apprennent à prédire ce qu'ils voient — mais pas forcément comment les choses fonctionnent vraiment. Résultat : un robot peut « voir » une action logique et la recommander alors qu'elle est physiquement impossible. Des chercheurs exposent le piège avec des benchmarks où deux scènes visuellement identiques cachent deux physiques différentes. Le robot prédit bien l'observation suivante dans les deux cas, mais échoue quand il doit agir : il confond ressemblance et causalité. C'est crucial pour les robots d'usine ou les systèmes autonomes — un modèle qui « hallucine » la physique peut causer des dégâts coûteux ou des accidents. La solution ? Construire des modèles qui comprennent la structure physique sous-jacente, pas seulement l'apparence des choses.
Les robots ont besoin de vraie physique, pas juste de beaux pixels0%comprends
Les robots ont besoin de vraie physique, pas juste de beaux pixels
Les modèles du monde actuels pour robots apprennent à prédire ce qu'ils voient — mais pas forcément comment les choses fonctionnent vraiment. Résultat : un robot peut « voir » une action logique et la

// illustration générée — IA7
/
// IA7 — L'IA. En clair. Maintenant.