熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
系統提示正在過時!
這裡有一個來自構建現實世界代理的反直覺教訓:
撰寫巨大的系統提示並不會改善代理的表現;它往往會使情況變得更糟。
例如,你添加了一條有關退款政策的規則。然後是有關語氣的規則。再來是有關何時升級的規則。不久之後,你就擁有了一本 2,000 字的說明手冊。
但我們學到的是:大型語言模型在處理這些方面非常差。
最近的研究也證實了我們許多人所經歷的情況。存在一種「指令詛咒」。你在提示中添加的規則越多,模型在遵循任何單一規則時的表現就越差。
這裡有一個更好的方法:上下文條件指導。
與其使用一個巨大的提示,不如將你的指示分解成模塊化的部分,只有在相關時才加載到大型語言模型中。
```
agent.create_guideline(
condition="客戶詢問退款",
action="首先檢查訂單狀態以查看是否符合條件",
tools=[check_order_status],
)
```
每個指導有兩個部分:
- 條件:什麼時候加載?
- 行動:代理應該做什麼?
魔法在幕後發生。當查詢到達時,系統評估哪些指導與當前對話狀態相關。
...

熱門
排行
收藏