LangChain propose Rubrics, une couche middleware qui ajoute une boucle d'auto-correction aux agents. Le principe : définir un référentiel de qualité, configurer un évaluateur, et laisser l'agent vérifier son propre travail avant de le livrer.
Cette approche résout un vrai problème pratique. Les agents autonomes hallucinaient ou livraient des réponses incohérentes, surtout sur des tâches où la précision compte (extraction de données, rédaction, calcul). Rubrics les force à relire et corriger en continu.
Cette approche résout un vrai problème pratique.
La mécanique : tu définis tes critères ("la réponse doit citer ses sources", "pas de contradiction logique"), tu attachs une LLM comme grader, et à chaque étape l'agent reçoit un feedback structuré. S'il échoue, il itère. C'est de la boucle de feedback classique, mais intégrée nativement dans le framework.
Concrètement : gain de fiabilité sans intervention humaine à chaque fois, mais coût en tokens (puisque chaque évaluation relance une LLM). À peser selon ton débit.

