Des chercheurs proposent un cadre où un agent LLM apprend à réécrire les requêtes légales de façon autonome, sans entraînement paramétrique. L'idée : équiper le modèle d'un environnement d'évaluation automatique qui lui permet de générer, tester et affiner des règles de reformulation, puis d'éliminer les inefficaces selon les retours historiques.
Le défi en récupération de cas légaux reste classique : l'alignement lexical entre requête et jurisprudence, où BM25 (recherche par mots-clés) continue de faire jeu égal avec les modèles denses modernes. Cette approche auto-évolutive vise à surpasser BM25 en tirant parti de la capacité du LLM à construire itérativement ses propres heuristiques.
L'intérêt : pas de fine-tuning coûteux, juste un agent qui observe ses erreurs et en tire des règles. Testé sur des corpus de cas chinois, le framework montre qu'une IA peut agir comme son propre optimiseur sans intervention humaine à chaque boucle.
Le vrai sujet : ce pattern de "self-improvement" pourrait s'étendre bien au-delà du droit — à tout domaine où une tâche est clairement évaluable et où les règles sont plus utiles que les poids.



