“你们应该多用 Bash。” 过去几周,Anthropic 的 Thariq 和几十家做通用智能体的公司开了电话会议。邮件助手、客服机器人、日程管理——各种产品形态都有。聊完一圈,他发现自己反复在说同一句话。 Bash?那不是程序员用的命令行工具吗,和这些产品有什么关系? 先看一个具体场景。 假设你有一个邮件 Agent,你问它:“这周我在打车上花了多少钱?” 传统做法是这样的:Agent 调用 API 拉取邮件,可能一次性取回 100 封,然后让模型从里面找 Uber、Lyft 的收据,加总金额。 问题在于 100 封邮件塞进上下文,模型要同时记住这些内容,从中筛选、计算。这对大语言模型来说并不轻松。容易漏,容易错,而且你没法验证它到底看了哪些邮件。 这就是典型的模型舒适区问题:数据量不算大到需要专门写程序处理,但又超出了模型一次性硬算的能力范围。夹在中间,很尴尬。 Thariq 的方案是:给 Agent 一个 Bash 工具,让它把中间结果存成文件。 听起来很简单,但背后的逻辑很有意思。 传统的工具调用是这样的流程: 工具 → 模型处理 → 输出结果 所有中间状态都在模型的“脑子”里,你看不见,也没法检查。 换成 Bash 之后,流程变了: 工具 → 存文件 → 搜索/过滤 → 模型处理 → 输出结果 ...