跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-12.99%
USELESS
-17.69%
IKUN
-24.45%
gib
-6.29%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-9.06%
ALON
-14.46%
LAUNCHCOIN
-11.68%
GOONC
-9.9%
KLED
+7.91%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-1.68%
Boopa
-32.08%
PORK
-20.21%
主頁
ℏεsam
AI工程師 |在學習曲線上嚴格過度擬合
查看原文
ℏεsam
9月24日 05:26
麥肯錫研究了50個自主AI構建案例及其最常失敗的地方,總結出6個對AI工程師至關重要的關鍵因素: 1. 關注工作流程,而不是代理。不要過於執著於構建“令人印象深刻”的代理。要考慮整個系統,而不是有趣的玩具。 2. 代理並不總是答案。 並非每個工作流程都需要多代理系統。低方差、可預測的任務最好用規則或機器學習處理,LLM增加了複雜性。代理的重大勝利出現在高方差、混亂的流程中(例如,提取複雜的財務信息)。 3. 避免“AI混亂”。(常見) 關注代理的長期發展,就像對待員工的發展一樣。忘掉令人印象深刻的演示。加倍努力於基準測試。代理應該有明確的工作描述,進行入職培訓,並獲得反饋,以便他們能夠定期改進。 4. 跟蹤每一步,而不僅僅是結果。 在沒有可見性的情況下擴大代理規模是要求無聲失敗。考慮監控工作流程的每個階段。這樣團隊可以及早發現錯誤,快速完善邏輯,避免全面崩潰。當錯誤發生時(而且它們會發生),你可以追蹤出錯的地方和原因。不要跳過這一步。 5. 儘可能重用代理。 許多公司浪費時間為每個任務構建一次性代理。更聰明的做法是創建可重用的模塊化代理組件(攝取、提取、驗證、分析),以便用於其他工作流程。集中驗證的工具和提示可以減少30-50%的冗餘工作,這個數字可不是開玩笑。 6. 人類仍然至關重要,但角色發生了變化。 代理可以解析、自動化和擴展。但人類提供判斷、邊緣案例處理和創造性問題解決。未來不是代理與人類的對立,而是代理與人類的結合。 這些是初創公司和成熟公司在規模化時所犯的錯誤。它們對聲譽和資源造成了巨大的損害。現在你知道如何避免這些問題。
242.43K
2.02K
ℏεsam
9月18日 03:46
研究界的每個人都對這篇在《自然》上發表的新DeepSeek論文感到瘋狂。這不是惡搞,他們確實發表了一篇新論文。
98.91K
1.04K
ℏεsam
9月17日 16:08
為什麼我們不為代理任務進行預訓練模型? 好吧,這些傢伙做到了。並且成功了。 他們在預訓練和後訓練之間引入了一個中間步驟。他們合成了代理動作數據,他們的AgentFounder-30B模型在10個基準測試中設定了新的SOTA。 在這個代理持續預訓練步驟之後,SFT的損失也顯著更小。 這為什麼有效? 因為通用基礎模型通常沒有代理歸納偏差,這將負擔放在後訓練上。 當你在預訓練階段引入多步驟推理和工具使用時,你為後訓練鋪平了道路,特別是當你用短期和長期代理任務的混合來做這件事時。 那麼,如果你在代理上運營你的業務或以任何規模構建它們,這意味著什麼? 你可以以低成本合成數據,進一步預訓練一個基礎模型,然後進行後訓練。
38.44K
394
熱門
排行
收藏