熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
現在我們已經將幾乎所有人類知識壓縮到大型語言模型中,下一步的前沿是工具調用。將不同的AI工具串聯在一起可以實現自動化。從思考到行動的轉變代表了AI實用性的真正突破。
我為自己構建了100多個工具,它們大多數時間都能正常工作,但並非總是如此。我並不孤單。Anthropic的經濟指數報告顯示,77%的商業使用Claude集中在全任務自動化,而不是協同駕駛。
Anthropic上週發佈了關於令牌效率和重新架構工具以優化其使用的文檔。該指導意見是反直覺的:與其創建許多簡單且標籤清晰的工具,不如創建更少但更複雜的工具。
以下是我構建的七個電子郵件工具——Ruby腳本,每個都有明確的目的。“安全發送電子郵件”腳本旨在防止AI在未經批准的情況下發送電子郵件。
美麗而天真,簡單而清晰,難道語言模型不應該能夠閱讀這些並確切知道我在要求它做什麼嗎?但事情並沒有那麼簡單!
Anthropic建議創建複雜的工具。他們的研究表明,當使用複雜的、參數豐富的工具而不是簡單工具時,“請求在輸出令牌上平均節省14%,最高可達70%”。原因是什麼?AI系統比片段化的意圖更好地理解完整的上下文。
我花了一個週末將所有工具整合成統一的工具,比如這個電子郵件工具:(第三張圖片)
對準確性的影響是立竿見影的。Claude的成功率接近100%。系統更快。因此,我使用的令牌大大減少,系統更高效。
這是我當前的思維模型:(第四張圖片)
當我為AI認知而不是人類直覺重新設計時,一切都得到了改善。我的CRM操作、日曆管理和數據庫工作流在整合成全面的、參數豐富的工具時變得更加可靠。準確性提高了,因此總成本顯著降低。
但別讓我使用這些工具。我現在在複雜性中有點迷失。這是以更高抽象層次工作不可避免的結果,不再深入理解機器。
我們花了幾十年讓軟件對人們變得簡單。現在我們正在學習如何讓它對AI變得複雜。



熱門
排行
收藏