DeepSeek OCR 下降了……但老实说,同一天发布的 Glyph [1] 显示出更有趣的东西:3–4 倍的上下文压缩和填充成本降低,在长上下文的问答和摘要中没有性能损失,这在许多情况下比 OCR 更不简单。 如果这适用于更困难的代理任务,那将是一个严重的飞跃。 在成本方面: - 填充成本急剧下降 - 启用 DSA 时解码节省更为温和 因此,影响取决于你的代理工作流程有多重输入(例如,深度研究与从头编码)。 同样相关的是: - BLT 扩展 [2,3] 改善了相对于 BPE 基线的扩展;Glyph 的激进压缩主要有助于填充,而对解码的帮助不大(启用 DSA 时)。 - BLT 化可能有助于 Glyph 进一步降低解码成本。 - 子代理对延迟和上下文长度的减少影响更大。简单而强大。 - 用小型 LM 替换视觉编码器仍然是一个悬而未决的问题。