DeepSeek OCRがドロップされました...しかし、正直なところ、同じ日にリリースされた Glyph [1] は、3-4× のコンテキスト圧縮と入力コストの削減、ロングコンテキスト QA と要約のパフォーマンスへの影響はなく、多くの場合 OCR よりもはるかに些細なことではありません。 それがより困難なエージェントタスクにも当てはまるのであれば、それは重大な飛躍です。 コスト面: - 充填コストが急激に低下 - デコードの節約は、DSAをオンにするとより控えめになります したがって、その影響は、エージェントワークフローがどれだけ入力量が多いかによって異なります (たとえば、詳細な調査とゼロからのコーディングなど)。 また関連: - BLT 拡張 [2,3] は、BPE ベースラインに対するスケーリングを改善しました。グリフの積極的な圧縮は主にインフィルに役立ちますが、デコードにはあまり役立ちません (DSA 付き)。 - BLT 化は、Glyph がデコード コストをさらに削減するのに役立ちます。 - サブエージェントは、レイテンシーとコンテキスト長の短縮に大きな影響を与えます。シンプルでありながらパワフル。 - そして、ビジョンエンコーダーを小型LMに交換することは、まだ未解決の問題です。