Anthropic lâche Claude Mythos Preview dans la nature via Project Glasswing avec 50 partenaires, et le modèle ne rigole pas : il débusque les vulnérabilités critiques en rafales. Résultat : plus de 10 000 failles détectées dans des logiciels système-critiques, et la machine accélère plus vite que les équipes de dev ne peuvent patcher.
Le problème ne vient pas de la qualité du travail — Claude excelle dans l'audit de code. C'est juste qu'il n'existe aucune limite réelle : il trouve les bugs, les énumère, les documente, et repart chercher les suivants pendant que les devs sont encore en réunion pour décider de la priorité du premier.
Le problème ne vient pas de la qualité du travail — Claude excelle dans l'audit de code.
Anthropologic tire la sonnette d'alarme : cette période de transition est à haut risque. Même les murs de sécurité qu'on a construits autour des modèles puissants (y compris chez Anthropic) ne suffisent pas à empêcher quelqu'un d'utiliser ce genre de capacité à des fins malveillantes. C'est pas du FUD non plus — c'est juste l'observation d'une asymétrie : créer des vulnérabilités pour un agent IA prend millisecondes, les colmater en prend des jours.
La vraie question n'est plus technique mais organizational : comment structurer les divulgations et les patches quand la découverte automatisée explose les délais historiques ? C'est le moment où la vitesse de l'IA rencontre l'inertie des processus de sécurité existants.

