Mira Murati sort de l'ombre avec Thinking Machines Lab et son premier modèle. Il traite l'audio, la vidéo et le texte en chunks de 200 millisecondes en parallèle — sans passer par le Q&A classique.
L'enjeu ? Casser le modèle conversationnel d'OpenAI avec GPT Realtime 2 et Google Gemini Live. Murati argue que la vraie qualité d'interaction, c'est pas d'attendre la fin d'une question pour réagir. Le détail qui tue : le système comprend et répond pendant que tu parles encore. C'est pas du streaming de réponse, c'est de la vraie fluidité.
C'est pas du streaming de réponse, c'est de la vraie fluidité..
Si ça tient ses promesses, on passe d'un modèle « je finis, tu finis, on parle » à quelque chose qui ressemble enfin à une vraie conversation. Les start-ups qui tablaient sur GPT Realtime 2 viennent de perdre un mois de certitude.
// Murati n'a pas attendu 18 mois pour critiquer OpenAI. Elle a juste livré un produit qui le dit mieux.

