DeepSeek OCR è crollato ... ma onestamente, Glyph [1], rilasciato lo stesso giorno, ha mostrato qualcosa di più interessante: compressione del contesto 3–4× e riduzione dei costi di infilling, senza impatti sulle prestazioni per QA e sintesi a lungo contesto, che è molto meno banale rispetto all'OCR in molti casi. Se ciò si mantiene per compiti agentici più difficili, sarebbe un salto serio. Dal punto di vista dei costi: - I costi di infilling scendono bruscamente - I risparmi in decodifica sono più modesti con DSA attivo Quindi l'impatto dipende da quanto è pesante in input il tuo flusso di lavoro agentico (ad es., ricerca approfondita vs codifica da zero). Anche rilevante: - Le estensioni BLT [2,3] hanno migliorato la scalabilità rispetto al baseline BPE; la compressione aggressiva di Glyph aiuta principalmente l'infilling, non molto nella decodifica (con DSA). - La BLT-ficazione potrebbe aiutare Glyph a ridurre ulteriormente i costi di decodifica. - I subagenti hanno un impatto maggiore sulla latenza e sulla riduzione della lunghezza del contesto. Semplice ma potente. - E sostituire gli encoder visivi con piccoli LM è ancora una questione aperta.