Les systèmes multi-agents construits sur des LLM échangent du texte brut entre eux, ce qui explose la consommation de tokens et bouffe le contexte partagé. Des chercheurs ont analysé cinq stratégies de communication inter-agents et découvert qu'aucune n'est universellement optimale — mais toutes les bonnes solutions préservent l'information centrée sur les actions, pas le bavardage. Le papier propose PACT, un protocole qui structure les messages entre agents pour ne transmettre que ce qui compte vraiment : l'état et l'action suivante.
Le problème est bête mais coûteux. Quand l'agent A demande à l'agent B "Qu'est-ce que tu as trouvé?", B répond souvent avec un roman explicatif. C'est du luxe cognitif que personne ne peut se payer à grande échelle. PACT impose un format : action effectuée, résultat pertinent, rien de plus.
Le vrai intérêt : ça réduit les coûts d'inférence sans sacrifier la performance du système. Pour les équipes qui font tourner des agents multi-étapes (orchestration, RAG distribué, planification), c'est du fuel injected direct dans le moteur.
Deux limites qu'on voit venir. D'abord, tu dois connaître à l'avance quelles données sont "pertinentes" pour downstream — si tu te trompes, tu casses ton pipeline. Ensuite, PACT suppose une topologie stable ; dès que tu ajoutes un agent ou que tu changes l'ordre, tu revisites tout. C'est du sur-mesure, pas du scaling automatique.

