O DeepSeek OCR caiu... mas, honestamente, o Glyph [1], lançado no mesmo dia, mostrou algo mais interessante: compressão de contexto de 3–4× e redução de custo de preenchimento, sem perda de desempenho em QA de longo contexto e sumarização, o que é muito menos trivial do que OCR em muitos casos. Se isso se mantiver para tarefas mais difíceis e agentivas, isso é um salto sério. Em termos de custo: - O custo de preenchimento cai drasticamente - As economias de decodificação são mais modestas com DSA ligado Portanto, o impacto depende de quão pesado em entrada é o seu fluxo de trabalho agentivo (por exemplo, pesquisa profunda vs codificação do zero). Também relevante: - As extensões BLT [2,3] melhoraram a escalabilidade em relação à linha de base BPE; a compressão agressiva do Glyph ajuda principalmente no preenchimento, não muito na decodificação (com DSA). - A BLT-ficação poderia ajudar o Glyph a reduzir ainda mais o custo de decodificação. - Subagentes têm um impacto maior na latência e na redução do comprimento do contexto. Simples, mas poderoso. - E trocar codificadores de visão por LMs pequenos ainda é uma questão em aberto.