$ skip to content
Multi-agents : comment enforcer les règles métier0%
Actu

Multi-agents : comment enforcer les règles métier

SDOF, un nouveau framework arXiv, impose des contraintes d'état aux orchestrateurs multi-agents comme LangChain et CrewAI. Jusqu'ici, ces systèmes routaient les tâches sans vérifier les étapes imposée

Multi-agents : comment enforcer les règles métier
// illustration générée — IA7
/

SDOF, un nouveau framework arXiv, impose des contraintes d'état aux orchestrateurs multi-agents comme LangChain et CrewAI. Jusqu'ici, ces systèmes routaient les tâches sans vérifier les étapes imposées par les processus métier réels.

Le truc : SDOF fonctionne comme une machine à états gardée. D'un côté, un routeur d'intentions (Online-RLHF) entraîné via Generative Reward Modeling décide par où passer. De l'autre, un StateAwareDispatcher avec vérifications d'automate fini et validation de pré/postconditions s'assure que chaque étape respecte les règles. C'est du contrôle auditable.

C'est subtil mais critique quand le process compte..

Tesé sur un système de recrutement (6000+ entreprises chez Beisen iTalent), avec 185 scénarios validés par des experts. Le résultat : réduire l'"alignment tax", ce coût caché quand l'IA fait ce qu'on lui dit mais pas comme le business le demande.

Ce qui change : fini les agents qui débarquent à l'étape 3 alors qu'on n'a pas encore terminé l'étape 1. C'est subtil mais critique quand le process compte.

-- glossaire

Online-RLHF

Reinforcement Learning from Human Feedback en temps réel, ici via Generative Reward Modeling (GRPO) pour entraîner le routeur d'intentions

StateAwareDispatcher

Composant qui valide chaque transition d'agent en vérifiant les pré/postconditions et l'automate fini

Alignment Tax

Coût caché quand l'IA répond correctement mais ne suit pas les contraintes métier du processus réel
[SOURCE] ArXiv AI
// IA7 — L'IA. En clair. Maintenant.