MiniMax, startup chinoise, vient de lâcher M3 : un modèle open-weight (code et poids accessibles) capable de traiter un million de tokens — soit l'équivalent de 750 000 mots d'affilée. C'est trois fois plus que Claude ou GPT-4. Le truc : M3 combine ça avec des perfs solides en code et la multimodalité native (texte + image + vidéo). Jusqu'à présent, c'étaient les labos propriétaires (OpenAI, Anthropic) qui dominaient sur ces trois fronts simultanément.
Pour toi qui utilises l'IA, ça change quoi ? Si tu dois scanner un dossier de 200 pages, synthétiser une base de code entière, ou traiter des vidéos longues sans rechunker, M3 devient une option. Et à l'inverse d'une API propriétaire, tu peux la faire tourner sur ton infra — pas de dépendance plateforme, pas de log d'utilisation qui traîne chez un tiers.
Pour toi qui utilises l'IA, ça change quoi .
Le contexte colossal, c'est la clé : plus de tokens = moins de « oublis » du modèle en conversation longue, meilleures synthèses de docs massifs. Pour le code, M3 revendique des scores proches des meilleurs. La multimodalité n'est pas du spectaculaire, mais elle est là.
Ce qui change pour l'industrie : l'open-weight devient sérieux. Pas juste un jouet éducatif, mais une alternative viable aux géants américains — surtout pour les boîtes qui ne veulent pas être captives d'OpenAI ou Google.

