Le patron de Microsoft met lui-même en garde contre le « token-maxing » — utiliser systématiquement les plus puissants modèles IA sur chaque problème. Son diagnostic : c'est inefficace économiquement, chaque gain de productivité doit justifier le coût en tokens consommés.
Mais voilà le twist. Nadella reconnaît publiquement qu'il fait exactement ça. « Je suis moi aussi un token-maxer. C'est addictif. » C'est drôle parce qu'il énonce une règle de bon sens — prioriser les modèles légers pour les tâches simples — tout en admettant que personne, pas même lui, ne la suit vraiment.
Ce constat révèle une tension réelle : les modèles puissants (GPT-4, Claude 3.5) offrent une expérience utilisateur tellement supérieure qu'on les utilise par habitude, pas par nécessité. Le coût marginal paraît négligeable jusqu'à la note de fin de mois.
La vraie question n'est pas morale, elle est économique. Si Microsoft avoue la difficulté à router intelligemment les requêtes, c'est qu'aucune abstraction technique ne remplace la discipline utilisateur.



