O OCR do DeepSeek caiu ... mas, honestamente, o Glyph [1], lançado no mesmo dia, mostrou algo mais interessante: 3 a 4× de compactação de contexto e redução de custos de preenchimento, nenhum impacto no desempenho no controle de qualidade e resumo de contexto longo, o que é muito menos trivial do que o OCR em muitos casos. Se isso vale para tarefas mais difíceis, é um salto sério. Em termos de custo: - O custo de preenchimento cai drasticamente - A economia de decodificação é mais modesta com DSA ativado Portanto, o impacto depende de quão pesado é o fluxo de trabalho agêntico (por exemplo, pesquisa profunda versus codificação do zero). Também relevante: - Extensões BLT [2,3] melhoraram o dimensionamento em relação à linha de base do BPE; a compressão agressiva do Glyph ajuda principalmente no preenchimento, não muito na decodificação (com DSA). - A bltificação pode ajudar a Glyph a reduzir ainda mais o custo de decodificação. - Os subagentes causam maior impacto na latência e na redução do comprimento do contexto. Simples, mas poderoso. - E trocar codificadores de visão por pequenos LMs ainda é uma questão em aberto.