$ skip to content
PACT: réduire le bruit dans les systèmes multi-agents LLM0%
utilise

PACT: réduire le bruit dans les systèmes multi-agents LLM

Les systèmes multi-agents construits sur des LLM échangent du texte brut entre eux, ce qui explose la consommation de tokens et bouffe le contexte partagé. Des chercheurs ont analysé cinq stratégies d

PACT: réduire le bruit dans les systèmes multi-agents LLM
// illustration générée — IA7
/

Les systèmes multi-agents construits sur des LLM échangent du texte brut entre eux, ce qui explose la consommation de tokens et bouffe le contexte partagé. Des chercheurs ont analysé cinq stratégies de communication inter-agents et découvert qu'aucune n'est universellement optimale — mais toutes les bonnes solutions préservent l'information centrée sur les actions, pas le bavardage. Le papier propose PACT, un protocole qui structure les messages entre agents pour ne transmettre que ce qui compte vraiment : l'état et l'action suivante.

Le problème est bête mais coûteux. Quand l'agent A demande à l'agent B "Qu'est-ce que tu as trouvé?", B répond souvent avec un roman explicatif. C'est du luxe cognitif que personne ne peut se payer à grande échelle. PACT impose un format : action effectuée, résultat pertinent, rien de plus.

Le vrai intérêt : ça réduit les coûts d'inférence sans sacrifier la performance du système. Pour les équipes qui font tourner des agents multi-étapes (orchestration, RAG distribué, planification), c'est du fuel injected direct dans le moteur.

Deux limites qu'on voit venir. D'abord, tu dois connaître à l'avance quelles données sont "pertinentes" pour downstream — si tu te trompes, tu casses ton pipeline. Ensuite, PACT suppose une topologie stable ; dès que tu ajoutes un agent ou que tu changes l'ordre, tu revisites tout. C'est du sur-mesure, pas du scaling automatique.

-- glossaire

Multi-agent system (MAS)

Ensemble d'agents IA indépendants qui collaborent pour résoudre une tâche complexe, souvent en passant des messages les uns aux autres.

Context window

Mémoire disponible d'un LLM pour traiter une requête ; chaque token la consume. Les systèmes multi-agents qui jargonnent trop la remplissent rapidement.

Token inflation

Croissance incontrôlée du nombre de tokens utilisés par une application, généralement due à une communication verbeux ou des boucles redondantes.

Action-centered communication

Protocole où les agents n'échangent que les informations strictement nécessaires à l'action suivante, éliminant le contexte non pertinent.
[SOURCE] ArXiv AI
// IA7 — L'IA. En clair. Maintenant.