OpenAI vient de lâcher MRC, un protocole réseau ouvert conçu avec AMD, Broadcom, Intel, Microsoft et NVIDIA. Le truc résout un problème que personne n'osait dire à haute voix : au-delà de 100 000 GPU dans un cluster, le réseau devient le goulot. MRC étale les paquets sur des centaines de chemins simultanément, comme distribuer un flux de trafic sur chaque route possible plutôt que de tout engouffrer dans une autoroute unique. Résultat : les clusters survivent aux défaillances matérielles en microsecondes au lieu de paralysie complète, et vous pouvez construire des supercalculateurs massifs avec juste deux étages de switches Ethernet au lieu de l'architecture complexe d'aujourd'hui.
Ce qui change concrètement ? Aujourd'hui, quand un lien réseau meurt dans une grappe de 100 000 GPU, c'est comme couper un artère — tout ralentit, tout re-route, chaos. Avec MRC, c'est un capillaire qui saute, les 99 autres chemins absorbent le flux. Les ingénieurs d'IA peuvent enfin scaler sans trembler que l'infrastructure réseau devienne le mur. OpenAI sait que les prochains modèles vont exiger des clusters de cette taille dans 12-18 mois. D'où l'ouverture du protocole : forcer l'industrie entière à adopter le même standard, obliger les fournisseurs à rendre leurs switches compatibles. C'est du pur jeu d'échecs — tu contrôles pas juste ton modèle, tu contrôles les couches en dessous.
Avec MRC, c'est un capillaire qui saute, les 99 autres chemins absorbent le flux.

