现在我们已经将几乎所有人类知识压缩到大型语言模型中,下一步的前沿是工具调用。将不同的AI工具串联在一起可以实现自动化。从思考到行动的转变代表了AI实用性的真正突破。 我为自己构建了100多个工具,它们大多数时间都能正常工作,但并非总是如此。我并不孤单。Anthropic的经济指数报告显示,77%的商业使用Claude集中在全任务自动化,而不是协同驾驶。 Anthropic上周发布了关于令牌效率和重新架构工具以优化其使用的文档。该指导意见是反直觉的:与其创建许多简单且标签清晰的工具,不如创建更少但更复杂的工具。 以下是我构建的七个电子邮件工具——Ruby脚本,每个都有明确的目的。“安全发送电子邮件”脚本旨在防止AI在未经批准的情况下发送电子邮件。 美丽而天真,简单而清晰,难道语言模型不应该能够阅读这些并确切知道我在要求它做什么吗?但事情并没有那么简单! Anthropic建议创建复杂的工具。他们的研究表明,当使用复杂的、参数丰富的工具而不是简单工具时,“请求在输出令牌上平均节省14%,最高可达70%”。原因是什么?AI系统比片段化的意图更好地理解完整的上下文。 我花了一个周末将所有工具整合成统一的工具,比如这个电子邮件工具:(第三张图片) 对准确性的影响是立竿见影的。Claude的成功率接近100%。系统更快。因此,我使用的令牌大大减少,系统更高效。 这是我当前的思维模型:(第四张图片) 当我为AI认知而不是人类直觉重新设计时,一切都得到了改善。我的CRM操作、日历管理和数据库工作流在整合成全面的、参数丰富的工具时变得更加可靠。准确性提高了,因此总成本显著降低。 但别让我使用这些工具。我现在在复杂性中有点迷失。这是以更高抽象层次工作不可避免的结果,不再深入理解机器。 我们花了几十年让软件对人们变得简单。现在我们正在学习如何让它对AI变得复杂。