Des chercheurs publient l'infrastructure réelle pour traiter des milliers de documents par heure en production. Résultat.
Le gap entre un modèle qui marche en labo et une pipeline capable de digérer 1000+ pages/heure, c'est pas rien. Cette équipe décortique leur stack : microservices, séparation GPU/CPU, asynchrone partout où ça IO-block, scaling horizontal. Classification → OCR → extraction structurée LLM, tout orchestré.
Les retours d'expérience en production .
C'est la transition qu'on attend depuis des années : les papers sur les modèles il y en a des milliers. Les retours d'expérience en production ? Rares. Ici, pas de théorie, que du vécu sur des documents réels à grande échelle.
Ca signifie une chose : Document AI n'est plus un prototype. C'est un truc qu'on peut mettre en ligne aujourd'hui sans prier. Les équipes risk/compliance qui attendent l'IA pour automatiser leurs workflows, elles ont une feuille de route d'architecture maintenant.

