Des chercheurs de Nvidia, Carnegie Mellon et UC Berkeley utilisent des agents de codage IA pour enseigner aux robots des tâches de saisie complexes en conditions réelles. Une flotte de huit robots atteint 99 % de succès sur des manipulations difficiles, sans intervention humaine manuelle après l'initialisation.
Cette approche combine la génération de code automatisée avec l'apprentissage par renforcement : l'agent IA écrit le code de contrôle du robot, qui teste sa stratégie en boucle fermée, puis améliore son propre code selon les résultats observés. Le modèle scalabilité est séduisant — former une flotte entière plutôt qu'un seul bras.
Le déverrouillage réel : ces robots apprennent par tâtonnement itératif en vrai, pas en simulation, ce qui contourne le classique "sim-to-real gap". C'est du machine learning incarné, pas de la théorie.
Les applications potentielles vont de l'usine aux entrepôts. Mais reste la question économique : à quel coût énergétique et computationnel cette auto-amélioration ? Et qui contrôle le code que l'agent génère ?






