$ skip to content
Murati lance son modèle. L'audio en temps réel, enfin0%
Actu

Murati lance son modèle. L'audio en temps réel, enfin

Mira Murati sort de l'ombre avec Thinking Machines Lab et son premier modèle. Il traite l'audio, la vidéo et le texte en chunks de 200 millisecondes en parallèle — sans passer par le Q&A classique.

Murati lance son modèle. L'audio en temps réel, enfin
// illustration générée — IA7
/

Mira Murati sort de l'ombre avec Thinking Machines Lab et son premier modèle. Il traite l'audio, la vidéo et le texte en chunks de 200 millisecondes en parallèle — sans passer par le Q&A classique.

L'enjeu ? Casser le modèle conversationnel d'OpenAI avec GPT Realtime 2 et Google Gemini Live. Murati argue que la vraie qualité d'interaction, c'est pas d'attendre la fin d'une question pour réagir. Le détail qui tue : le système comprend et répond pendant que tu parles encore. C'est pas du streaming de réponse, c'est de la vraie fluidité.

C'est pas du streaming de réponse, c'est de la vraie fluidité..

Si ça tient ses promesses, on passe d'un modèle « je finis, tu finis, on parle » à quelque chose qui ressemble enfin à une vraie conversation. Les start-ups qui tablaient sur GPT Realtime 2 viennent de perdre un mois de certitude.

// Murati n'a pas attendu 18 mois pour critiquer OpenAI. Elle a juste livré un produit qui le dit mieux.

-- glossaire

Chunks parallèles

Traitement simultané de morceaux audio/vidéo/texte au lieu de façon séquentielle — permet une réaction immédiate sans attendre la fin d'une phrase

Q&A model (modèle conversationnel classique)

Système qui attend qu'une question soit complète avant de générer une réponse — le modèle standard d'OpenAI et Google
[SOURCE] The Decoder
// IA7 — L'IA. En clair. Maintenant.