Google DeepMind vient de franchir un cap symbolique : son système AlphaProof Nexus a résolu neuf problèmes ouverts d'Erdős en autonomie, dont deux qui bloquaient les mathématiciens depuis 56 ans. Le coût ? Quelques centaines de dollars par problème en calcul d'inférence. Là où OpenAI jouait sur le langage naturel, DeepMind a pris un chemin différent : chaque étape de preuve est vérifiée automatiquement par le compilateur Lean, ce qui élimine les hallucinations et garantit la rigueur formelle. Sauf que le taux de succès reste très bas, autour de 2,5 %, ce qui tempère l'enthousiasme initial.
Ce qui change, c'est que les IA ne se contentent plus de prédire — elles peuvent désormais générer des preuves mathématiques valides et vérifiables. C'est un signal fort que les systèmes de raisonnement symbolique combinés aux modèles de langage commencent à débloquer des problèmes réputés hors de portée. Les mathématiques, domaine réputé inaccessible aux machines, craque sous la pression de l'IA.
Les mathématiques, domaine réputé inaccessible aux machines, craque sous la pression de l'IA..

