DeepSeek OCR упал ... но, честно говоря, Glyph [1], выпущенный в тот же день, показал что-то более интересное: 3–4× сжатие контекста и снижение затрат на заполнение, без потери производительности при долгосрочном QA и суммировании, что в многих случаях гораздо менее тривиально, чем OCR. Если это будет работать для более сложных агентных задач, это серьезный скачок. С точки зрения затрат: - Затраты на заполнение резко падают - Экономия на декодировании более скромная при включенном DSA Таким образом, влияние зависит от того, насколько ваш агентный рабочий процесс зависит от ввода (например, глубокие исследования против кодирования с нуля). Также актуально: - Расширения BLT [2,3] улучшили масштабируемость по сравнению с базовой линией BPE; агрессивное сжатие Glyph в основном помогает заполнению, не так уж много на декодировании (с DSA). - BLT-фикация может помочь Glyph еще больше снизить затраты на декодирование. - Субагенты оказывают большее влияние на задержку и сокращение длины контекста. Просто, но мощно. - И замена визуальных кодировщиков на небольшие LM все еще остается открытым вопросом.