DeepSeek OCR droppet ... men ærlig talt, Glyph [1], utgitt samme dag, viste noe mer interessant: 3–4× kontekstkomprimering og kostnadsreduksjon for utfylling, ingen ytelsestreff på QA og oppsummering med lang kontekst, noe som er mye mindre trivielt enn OCR i mange tilfeller. Hvis det gjelder vanskeligere agentiske oppgaver, er det et alvorlig sprang. Kostnadsmessig: - Utfyllingskostnadene synker kraftig - Dekodingsbesparelser er mer beskjedne med DSA på Så virkningen avhenger av hvor inndatatung agentarbeidsflyten din er (f.eks. dyp forskning kontra koding fra bunnen av). Også relevant: - BLT-utvidelser [2,3] forbedret skalering i forhold til BPE-grunnlinjen; aggressiv komprimering av Glyph hjelper hovedsakelig med å fylle ut, ikke mye på dekoding (med DSA). - BLT-fisjon kan hjelpe Glyph med å redusere dekodingskostnadene ytterligere. - Underagenter har større innvirkning på ventetid og reduksjon av kontekstlengde. Enkelt, men kraftig. - Og å bytte ut vision-kodere med små LM-er er fortsatt et åpent spørsmål.