Les workflows autonomes ne ressemblent plus aux chatbots classiques : ils consomment des dizaines de fois plus de tokens, tournent pendant des heures sans interaction humaine, et rendent les forfaits mensuels non viables pour les fournisseurs. OpenAI, Anthropic et les autres pivotent vers un modèle de facturation à la consommation, où le prix du token varie selon la vitesse, la spécialisation du modèle et la valeur économique du résultat généré.
Le problème : un token bon marché ne dit rien sur le coût réel. Un agent qui tourne 8 heures et brûle 10 millions de tokens coûte bien plus cher que 1 million de tokens consommés instantanément. Les prix affichés deviennent illisibles, et les entreprises ne savent plus à quoi s'attendre en fin de mois.
Un token n'est pas une unité neutre — c'est une unité de coût masqué. La valeur créée dépend du contexte (un token dans une recherche légale pèse plus qu'un token dans un résumé). Les vieux modèles de tarification cassent. Les nouveaux émergent, opaques.
Résultat : ceux qui adoptent les agents IA doivent négocier des contrats sur mesure, implémenter des budgets stricts par workflow, et surveiller la consommation en temps réel. L'ère du "paye 20 $/mois, fais ce que tu veux" est terminée.



