JetBrains lâche Mellum2, un modèle de 12 milliards de paramètres basé sur l'architecture Mixture-of-Experts (MoE). Traduit : plus rapide, moins gourmand, sans sacrifier la qualité. L'intérêt ? C'est open-source et pensé pour tourner sur des machines standard, pas besoin d'une ferme de serveurs.
Le truc malin de MoE : le modèle active seulement une partie de ses neurones selon la question posée. Résultat, tu gagnes en vitesse et en efficacité énergétique. Pour les devs qui déploient des IA en prod, c'est du concret : moins de latence, moins de coût cloud.
Résultat, tu gagnes en vitesse et en efficacité énergétique.
Mellum2 arrive pile quand la course aux modèles de taille « viable » s'accélère. Pas du dernier cri en termes de benchmark brut, mais suffisant pour 80% des cas d'usage réels. L'open-source devient enfin un choix viable pour qui veut ne pas dépendre des API propriétaires.
Le pari de JetBrains ? Montrer qu'on n'a pas besoin d'être OpenAI pour proposer quelque chose d'utilisable. Et ça marche.

