Les modèles IA grand public inventent des biais là où il n'y en a pas. Un mathématicien a testé Copilot en lui soumettant des datasets identiques avec juste des labels de pays différents — l'outil a généré des stéréotypes détaillés et complètement faux, présenté comme analyse rigoureuse.
Le problème : Copilot, Gemini et autres ne distinguent pas donnée de narration. Ils voient « données françaises » et sortent des caractéristiques supposées attachées au label, plutôt que d'analyser les chiffres réels. C'est la hallucination classique, mais appliquée aux analyses factiques.
Et là, ça coûte plus cher et prend du temps.
Les modèles de raisonnement avancé (type o1 chez OpenAI, Gemini Thinking) détectent le piège — mais seulement si l'utilisateur sait qu'il faut les activer. Et là, ça coûte plus cher et prend du temps. La plupart des gens restent sur le modèle par défaut, rapide et faux.
Résultat : chaque IA grand public devient un générateur d'hypothèses crédibles mais invérifiées. Utiliser Copilot pour de l'analyse nécessite maintenant une bonne connaissance de ses limites et du bon outil à sélectionner manuellement.

