DeepSeek OCR spadł ... ale szczerze mówiąc, Glyph [1], wydany tego samego dnia, pokazał coś bardziej interesującego: 3–4× kompresję kontekstu i redukcję kosztów infillingu, bez spadku wydajności w długim kontekście QA i podsumowania, co w wielu przypadkach jest znacznie mniej trywialne niż OCR. Jeśli to się sprawdzi w trudniejszych zadaniach agentowych, to będzie poważny skok. Pod względem kosztów: - Koszt infillingu spada gwałtownie - Oszczędności na dekodowaniu są bardziej skromne przy włączonym DSA Zatem wpływ zależy od tego, jak obciążony danymi jest twój agentowy workflow (np. głębokie badania vs kodowanie od podstaw). Również istotne: - Rozszerzenia BLT [2,3] poprawiły skalowanie w porównaniu do podstawy BPE; agresywna kompresja Glyph głównie pomaga w infillingu, nie za dużo w dekodowaniu (przy DSA). - BLT-fikacja mogłaby pomóc Glyph w dalszej redukcji kosztów dekodowania. - Subagenci mają większy wpływ na opóźnienia i redukcję długości kontekstu. Proste, ale potężne. - A wymiana enkoderów wizji na małe LMs wciąż pozostaje otwartym pytaniem.