Multi-agents : comment enforcer les règles métier

SDOF, un nouveau framework arXiv, impose des contraintes d'état aux orchestrateurs multi-agents comme LangChain et CrewAI. Jusqu'ici, ces systèmes routaient les tâches sans vérifier les étapes imposée

// IA7 · 18/05/26 - 10:00

Multi-agents : comment enforcer les règles métier

// illustration générée — IA7

Le truc : SDOF fonctionne comme une machine à états gardée. D'un côté, un routeur d'intentions (Online-RLHF) entraîné via Generative Reward Modeling décide par où passer. De l'autre, un StateAwareDispatcher avec vérifications d'automate fini et validation de pré/postconditions s'assure que chaque étape respecte les règles. C'est du contrôle auditable.

C'est subtil mais critique quand le process compte..

Tesé sur un système de recrutement (6000+ entreprises chez Beisen iTalent), avec 185 scénarios validés par des experts. Le résultat : réduire l'"alignment tax", ce coût caché quand l'IA fait ce qu'on lui dit mais pas comme le business le demande.

Ce qui change : fini les agents qui débarquent à l'étape 3 alors qu'on n'a pas encore terminé l'étape 1. C'est subtil mais critique quand le process compte.

-- glossaire

Online-RLHF

— Reinforcement Learning from Human Feedback en temps réel, ici via Generative Reward Modeling (GRPO) pour entraîner le routeur d'intentions

StateAwareDispatcher

— Composant qui valide chaque transition d'agent en vérifiant les pré/postconditions et l'automate fini

Alignment Tax

— Coût caché quand l'IA répond correctement mais ne suit pas les contraintes métier du processus réel

[SOURCE] ArXiv AI

// IA7 — L'IA. En clair. Maintenant.