DeepSeek OCR đã giảm ... nhưng thật sự, Glyph [1], được phát hành cùng ngày, đã cho thấy điều gì đó thú vị hơn: nén ngữ cảnh 3–4× và giảm chi phí điền vào, không ảnh hưởng đến hiệu suất trong QA và tóm tắt ngữ cảnh dài, điều này không hề đơn giản hơn OCR trong nhiều trường hợp. Nếu điều đó đúng với các nhiệm vụ tác động khó khăn hơn, đó là một bước nhảy vọt nghiêm trọng. Về chi phí: - Chi phí điền vào giảm mạnh - Tiết kiệm giải mã thì khiêm tốn hơn với DSA bật Vì vậy, tác động phụ thuộc vào mức độ nặng nề của quy trình làm việc tác động của bạn (ví dụ: nghiên cứu sâu so với lập trình từ đầu). Cũng liên quan: - Các mở rộng BLT [2,3] cải thiện khả năng mở rộng so với cơ sở BPE; nén mạnh mẽ của Glyph chủ yếu giúp điền vào, không nhiều về giải mã (với DSA). - Việc BLT hóa có thể giúp Glyph giảm chi phí giải mã hơn nữa. - Các tác nhân phụ tạo ra tác động lớn hơn đến độ trễ và giảm độ dài ngữ cảnh. Đơn giản nhưng mạnh mẽ. - Và việc thay thế các bộ mã hóa hình ảnh bằng các LM nhỏ vẫn là một câu hỏi mở.