一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动 | OKX Wallet

热门话题

#

Bonk 生态迷因币展现强韧势头

#

有消息称 Pump.fun 计划 40 亿估值发币，引发市场猜测

LAUNCHCOIN+0.7%

#

Solana 新代币发射平台 Boop.Fun 风头正劲

header

yan5xu

🤖 AI新手

yan5xu

yan5xu10 小时前

刚深扒了一下 MiroThinker 1.5，他们这套 Agent 压缩方式有点邪门，但看懂了觉得确实有用。核心解决的是「怎么在 256K 上下文里塞进去 400 次 Tool Use」的问题。他们做了一个极其大胆的操作：对ReAct历史上 think-action-observation 中的的 Observation（工具返回结果）进行物理掩码。除了最近 K 轮保留原文，之前的几百轮 Tool Result 全部替换成一句 "Tool result is omitted to save tokens"。但是完整保留了所有的 <thought>。这里面有一个非常反直觉的地方，这个 agent 本身就是在做 deep research，那他只留最近 K 轮，也就是 5 轮的原文，前面都没有了，还怎么能回答问题。这就有一个非常隐晦但关键的前提：只要 Thought 足够密，它其实就是在无限逼近 Summary。每一次 Thought 的生成，本质上都是模型对当前 Observation 的一次信息切片。T1 产生时已经把 O1 里的关键数据“吃”进脑子了。虽然 O1 被替换成了占位符，但 T1 还在。T1 就成了 O1 的“信息压缩包”。不需要额外挂一个 Summary Agent，这条完整的 Thought 链，本身就是一份不断增量更新的、高保真的「动态摘要」。

50

yan5xu

yan5xu1月3日 18:12

关于 context engineering。有两个问题，我觉得特别能看出人的水平，问他在 XX 业务场景下面，read_file, write_file 如何设计。如果真的只有读，写具体文件，就可以到此结束。

146

yan5xu

yan5xu2025年11月26日

anthropic 真的是一环扣一环有理论有实践在发 skills 的时候，针对工具膨胀浪费 token 提出了， Prompt 分层加载/复用，用代码执行&串联api/mcp（manus 把这个叫做上下文卸载）两个方法前天发 opus 的同时，把这两个方法固定到了推理 API 层面，Tool Search Tool，解决工具的发现&懒加载，Programmatic Tool Calling 实现代码执行工具。感觉以后anthropic api协议😂大有替代 openai 的可能

284

热门

排行

收藏

©2017 - 2026 WEB3.OKX.COM

简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska Türkçe

关于 OKX Wallet

下载学院关于我们就业机会联系我们服务条款隐私政策 X (原推特)

产品

行情币币兑换市场赚币发现开发者中心浏览器安全

用户支持

帮助中心官方渠道验证公告 DEX 费率标准加入社群比特币钱包以太坊钱包 Solana 钱包