Des chercheurs proposent Arbor, un framework multi-agent qui intègre la recherche structurée en arbre comme couche cognitive pour les agents autonomes opérant dans des espaces d'action massifs et stateful. Contrairement aux systèmes précédents qui optimisent des cibles isolées, Arbor maintient un arbre de recherche explicite — une mémoire de travail partagée entre agents — qui évolue à chaque mesure et traite les échecs comme des signaux diagnostiques pour affiner l'exploration suivante.
L'approche est validée sur l'optimisation d'inférence LLM full-stack, terrain où atteindre les performances de pointe exigeait historiquement l'effort coordonné d'équipes d'engineering. Cette structure arborescentelle redistribue dynamiquement l'exploration en fonction du succès antérieur : quand une piste réussit, le système redéploie ses efforts ailleurs, déplaçant le goulot d'étranglement.
L'innovation tient moins à la recherche en arbre elle-même — connue depuis l'époque des jeux — qu'à son intégration comme primitive de coordination entre agents autonomes. Cela ouvre la voie à des systèmes d'optimisation auto-pilotés sans intervention humaine.
Arxiv : preprint académique, pas encore peer-reviewed ni déployé en production.




