DeepSeek OCR a chuté... mais honnêtement, Glyph [1], sorti le même jour, a montré quelque chose de plus intéressant : une compression de contexte de 3 à 4 fois et une réduction des coûts d'infilling, sans impact sur les performances en QA et résumé à long contexte, ce qui est beaucoup moins trivial que l'OCR dans de nombreux cas. Si cela se maintient pour des tâches agentiques plus difficiles, c'est un saut sérieux. En termes de coûts : - Les coûts d'infilling chutent fortement - Les économies de décodage sont plus modestes avec DSA activé Donc, l'impact dépend de la charge d'entrée de votre flux de travail agentique (par exemple, recherche approfondie contre codage à partir de zéro). Aussi pertinent : - Les extensions BLT [2,3] ont amélioré l'évolutivité par rapport à la base BPE ; la compression agressive de Glyph aide principalement à l'infilling, pas beaucoup au décodage (avec DSA). - La BLT-fication pourrait aider Glyph à réduire encore les coûts de décodage. - Les sous-agents ont un impact plus important sur la latence et la réduction de la longueur du contexte. Simple mais puissant. - Et remplacer les encodeurs de vision par de petits LMs est toujours une question ouverte.