一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

现在我们已经将几乎所有人类知识压缩到大型语言模型中，下一步的前沿是工具调用。将不同的AI工具串联在一起可以实现自动化。从思考到行动的转变代表了AI实用性的真正突破。我为自己构建了100多个工具，它们大多数时间都能正常工作，但并非总是如此。我并不孤单。Anthropic的经济指数报告显示，77%的商业使用Claude集中在全任务自动化，而不是协同驾驶。 Anthropic上周发布了关于令牌效率和重新架构工具以优化其使用的文档。该指导意见是反直觉的：与其创建许多简单且标签清晰的工具，不如创建更少但更复杂的工具。以下是我构建的七个电子邮件工具——Ruby脚本，每个都有明确的目的。“安全发送电子邮件”脚本旨在防止AI在未经批准的情况下发送电子邮件。美丽而天真，简单而清晰，难道语言模型不应该能够阅读这些并确切知道我在要求它做什么吗？但事情并没有那么简单！ Anthropic建议创建复杂的工具。他们的研究表明，当使用复杂的、参数丰富的工具而不是简单工具时，“请求在输出令牌上平均节省14%，最高可达70%”。原因是什么？AI系统比片段化的意图更好地理解完整的上下文。我花了一个周末将所有工具整合成统一的工具，比如这个电子邮件工具：（第三张图片）对准确性的影响是立竿见影的。Claude的成功率接近100%。系统更快。因此，我使用的令牌大大减少，系统更高效。这是我当前的思维模型：（第四张图片）当我为AI认知而不是人类直觉重新设计时，一切都得到了改善。我的CRM操作、日历管理和数据库工作流在整合成全面的、参数丰富的工具时变得更加可靠。准确性提高了，因此总成本显著降低。但别让我使用这些工具。我现在在复杂性中有点迷失。这是以更高抽象层次工作不可避免的结果，不再深入理解机器。我们花了几十年让软件对人们变得简单。现在我们正在学习如何让它对AI变得复杂。