SDOF, un nouveau framework arXiv, impose des contraintes d'état aux orchestrateurs multi-agents comme LangChain et CrewAI. Jusqu'ici, ces systèmes routaient les tâches sans vérifier les étapes imposées par les processus métier réels.
Le truc : SDOF fonctionne comme une machine à états gardée. D'un côté, un routeur d'intentions (Online-RLHF) entraîné via Generative Reward Modeling décide par où passer. De l'autre, un StateAwareDispatcher avec vérifications d'automate fini et validation de pré/postconditions s'assure que chaque étape respecte les règles. C'est du contrôle auditable.
C'est subtil mais critique quand le process compte..
Tesé sur un système de recrutement (6000+ entreprises chez Beisen iTalent), avec 185 scénarios validés par des experts. Le résultat : réduire l'"alignment tax", ce coût caché quand l'IA fait ce qu'on lui dit mais pas comme le business le demande.
Ce qui change : fini les agents qui débarquent à l'étape 3 alors qu'on n'a pas encore terminé l'étape 1. C'est subtil mais critique quand le process compte.

