DeepSeek OCR впав ... але, чесно кажучи, Glyph [1], випущений того ж дня, показав дещо цікавіше: 3–4× стиснення контексту та зниження вартості заповнення, відсутність удару по продуктивності на QA з довгим контекстом та підсумовування, що в багатьох випадках набагато менш тривіально, ніж OCR. Якщо це стосується складніших агентських завдань, це серйозний стрибок. За вартістю: - Вартість заповнення різко падає - Економія на розшифровці скромніша з DSA на Таким чином, вплив залежить від того, наскільки інтенсивним є ваш агентний робочий процес (наприклад, глибокі дослідження проти кодування з нуля). Також актуально: - Розширення BLT [2,3] покращено масштабування порівняно з базовим рівнем BPE; агресивне стиснення Glyph в основному допомагає заповненню, а не сильно на декодуванні (з DSA). - BLT-фікація може допомогти Glyph ще більше знизити вартість декодування. - Субагенти мають більший вплив на зменшення затримки та довжини контексту. Простий, але потужний. - А заміна візуальних енкодерів на маленькі ЛМ – поки що відкрите питання.