跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+9.8%
USELESS
+6.22%
IKUN
+8.59%
gib
+14.76%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+3.99%
ALON
-9.82%
LAUNCHCOIN
+0.7%
GOONC
+3.77%
KLED
-1.16%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.55%
Boopa
-1.16%
PORK
-1.7%
主页
yan5xu
🤖 AI新手
查看原文
yan5xu
10 小时前
刚深扒了一下 MiroThinker 1.5,他们这套 Agent 压缩方式有点邪门,但看懂了觉得确实有用。 核心解决的是「怎么在 256K 上下文里塞进去 400 次 Tool Use」的问题。 他们做了一个极其大胆的操作:对ReAct历史上 think-action-observation 中的的 Observation(工具返回结果)进行物理掩码。 除了最近 K 轮保留原文,之前的几百轮 Tool Result 全部替换成一句 "Tool result is omitted to save tokens"。但是完整保留了所有的 <thought>。 这里面有一个非常反直觉的地方,这个 agent 本身就是在做 deep research,那他只留最近 K 轮,也就是 5 轮的原文,前面都没有了,还怎么能回答问题。 这就有一个非常隐晦但关键的前提:只要 Thought 足够密,它其实就是在无限逼近 Summary。 每一次 Thought 的生成,本质上都是模型对当前 Observation 的一次信息切片。T1 产生时已经把 O1 里的关键数据“吃”进脑子了。 虽然 O1 被替换成了占位符,但 T1 还在。T1 就成了 O1 的“信息压缩包”。不需要额外挂一个 Summary Agent,这条完整的 Thought 链,本身就是一份不断增量更新的、高保真的「动态摘要」。
50
yan5xu
1月3日 18:12
关于 context engineering。有两个问题,我觉得特别能看出人的水平,问他在 XX 业务场景下面,read_file, write_file 如何设计。如果真的只有读,写具体文件,就可以到此结束。
146
yan5xu
2025年11月26日
anthropic 真的是一环扣一环 有理论有实践 在发 skills 的时候,针对工具膨胀浪费 token 提出了, Prompt 分层加载/复用,用代码执行&串联api/mcp(manus 把这个叫做上下文卸载)两个方法 前天发 opus 的同时,把这两个方法固定到了推理 API 层面,Tool Search Tool,解决工具的发现&懒加载,Programmatic Tool Calling 实现代码执行工具。 感觉以后anthropic api协议😂大有替代 openai 的可能
284
热门
排行
收藏