L'Institut de la langue estonienne vient de publier un benchmark mesurant la vulnérabilité des modèles de langage face à la propagande russe. Un exercice qui dépasse la simple curiosité académique : il s'agit de cartographier comment les systèmes d'IA absorbent, amplifient ou restituent des narratifs politiques biaisés sans même le savoir.
Le test pose une question dérangeante : à quel point les grands modèles (GPT, Claude, Llama) régurgitent-ils des biais géopolitiques encodés dans leurs données d'entraînement ? La propagande n'a pas besoin de crier ; elle s'insinue dans les corpus textuels qu'on gave aux IA, puis elle ressort sous forme de suggestions, de priorisations de réponses, de tonalités subtiles.
Cet benchmark estonien fait partie d'une vague plus large de tests de robustesse civique. On commence à comprendre que l'IA n'est pas neutre par défaut — elle reflète les batailles informationnelles de son époque. Pas de terreur apocalyptique ici, juste du pragmatisme : si tu utilises une IA pour rédiger ou analyser des contenus géopolitiques, il faut savoir où elle penche.
La parade : connaître ces biais de ses outils, croiser les sources, tester avec plusieurs modèles entraînés différemment. Pas de solution miracle, juste du discernement accru.



