跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-4.78%
USELESS
+4.8%
IKUN
-10.38%
gib
-7.85%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-1.62%
ALON
-3.3%
LAUNCHCOIN
-3.58%
GOONC
+0.95%
KLED
-2.06%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-1.96%
Boopa
-26.27%
PORK
+3.19%
主页
ℏεsam
AI 工程师 |严格过拟合学习曲线
查看原文
ℏεsam
9月24日 05:26
麦肯锡研究了50个自主AI构建案例及其最常失败的地方,总结出6个对AI工程师至关重要的关键因素: 1. 关注工作流程,而不是代理。不要过于执着于构建“令人印象深刻”的代理。要考虑整个系统,而不是有趣的玩具。 2. 代理并不总是答案。 并非每个工作流程都需要多代理系统。低方差、可预测的任务最好用规则或机器学习处理,LLM增加了复杂性。代理的重大胜利出现在高方差、混乱的流程中(例如,提取复杂的财务信息)。 3. 避免“AI混乱”。(常见) 关注代理的长期发展,就像对待员工的发展一样。忘掉令人印象深刻的演示。加倍努力于基准测试。代理应该有明确的工作描述,进行入职培训,并获得反馈,以便他们能够定期改进。 4. 跟踪每一步,而不仅仅是结果。 在没有可见性的情况下扩大代理规模是要求无声失败。考虑监控工作流程的每个阶段。这样团队可以及早发现错误,快速完善逻辑,避免全面崩溃。当错误发生时(而且它们会发生),你可以追踪出错的地方和原因。不要跳过这一步。 5. 尽可能重用代理。 许多公司浪费时间为每个任务构建一次性代理。更聪明的做法是创建可重用的模块化代理组件(摄取、提取、验证、分析),以便用于其他工作流程。集中验证的工具和提示可以减少30-50%的冗余工作,这个数字可不是开玩笑。 6. 人类仍然至关重要,但角色发生了变化。 代理可以解析、自动化和扩展。但人类提供判断、边缘案例处理和创造性问题解决。未来不是代理与人类的对立,而是代理与人类的结合。 这些是初创公司和成熟公司在规模化时所犯的错误。它们对声誉和资源造成了巨大的损害。现在你知道如何避免这些问题。
222.58K
1.87K
ℏεsam
9月18日 03:46
研究界的每个人都对这篇在《自然》上发表的新DeepSeek论文感到疯狂。这不是恶搞,他们确实发表了一篇新论文。
98.91K
1.04K
ℏεsam
9月17日 16:08
为什么我们不为代理任务进行预训练模型? 好吧,这些家伙做到了。并且成功了。 他们在预训练和后训练之间引入了一个中间步骤。他们合成了代理动作数据,他们的AgentFounder-30B模型在10个基准测试中设定了新的SOTA。 在这个代理持续预训练步骤之后,SFT的损失也显著更小。 这为什么有效? 因为通用基础模型通常没有代理归纳偏差,这将负担放在后训练上。 当你在预训练阶段引入多步骤推理和工具使用时,你为后训练铺平了道路,特别是当你用短期和长期代理任务的混合来做这件事时。 那么,如果你在代理上运营你的业务或以任何规模构建它们,这意味着什么? 你可以以低成本合成数据,进一步预训练一个基础模型,然后进行后训练。
38.43K
394
热门
排行
收藏