“你們應該多用 Bash。” 過去幾周,Anthropic 的 Thariq 和幾十家做通用智能體的公司開了電話會議。郵件助手、客服機器人、日程管理——各種產品形態都有。聊完一圈,他發現自己反覆在說同一句話。 Bash?那不是程序員用的命令行工具嗎,和這些產品有什麼關係? 先看一個具體場景。 假設你有一個郵件 Agent,你問它:“這周我在打車上花了多少錢?” 傳統做法是這樣的:Agent 調用 API 拉取郵件,可能一次性取回 100 封,然後讓模型從裡面找 Uber、Lyft 的收據,加總金額。 問題在於 100 封郵件塞進上下文,模型要同時記住這些內容,從中篩選、計算。這對大語言模型來說並不輕鬆。容易漏,容易錯,而且你沒法驗證它到底看了哪些郵件。 這就是典型的模型舒適區問題:數據量不算大到需要專門寫程序處理,但又超出了模型一次性硬算的能力範圍。夾在中間,很尷尬。 Thariq 的方案是:給 Agent 一個 Bash 工具,讓它把中間結果存成文件。 聽起來很簡單,但背後的邏輯很有意思。 傳統的工具調用是這樣的流程: 工具 → 模型處理 → 輸出結果 所有中間狀態都在模型的“腦子”裡,你看不見,也沒法檢查。 換成 Bash 之後,流程變了: 工具 → 存文件 → 搜索/過濾 → 模型處理 → 輸出結果 ...