跳轉至主要內容
行情
掃鏈
追蹤
信號
跟單
兌換
資產
邀請計劃
更多
產品
DeFi
市場
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-0.25%
USELESS
-2.59%
IKUN
-10.6%
gib
-13.06%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-5.01%
ALON
+3.28%
LAUNCHCOIN
-3.27%
GOONC
-2.11%
KLED
-1.31%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-1.05%
Boopa
-1.74%
PORK
0.00%
主頁
elvis
使用 AI 代理進行構建 @dair_ai • 上一篇: Meta AI、Galactica、LLM、Elastic、PaperswithCode、博士 • 我分享瞭如何使用 LLM 和 AI 代理⬇️進行構建的見解
查看原文
elvis
5 小時前
終於有機會玩玩 @karpathy 的 LLM Council。 我把它作為 Claude Code 內部的一個插件來構建。 將其與 OpenRouter 連接以獲取模型。 AskUserQuestion 工具在選擇委員會和主席時派上了用場。 這是我的第一次測試,但我同意 Karpathy 的看法,LLM 集合的概念可以用於超越提供有趣問題觀點的模型。 我覺得這在代理編碼中可能會有非常酷的應用。稍後會有更多相關內容。 我把這個作為插件構建,所以接下來我將探索其他與代理編碼相關的用例,比如評估、工具構建、設計和研究。 如果有足夠的興趣,我會整理一下並將其作為開放插件推出。
29
elvis
6 小時前
AI 編碼代理實際上會寫測試嗎? 測試對於軟體的正確性和可維護性至關重要。隨著自主代理越來越多地提交拉取請求,了解它們的測試行為變得至關重要。 這項新研究分析了 AIDev 數據集,以研究代理生成的拉取請求中的測試包含模式。 他們檢查了測試出現的頻率、在 PR 生命週期中何時引入測試,以及包含測試的 PR 與不包含測試的 PR 之間的差異。 研究結果揭示了有趣的模式。隨著時間的推移,包含測試的 PR 在各代理中變得越來越普遍,這表明測試行為有所改善。但這些 PR 通常比不包含測試的 PR 更大,且完成所需的時間更長。 無論測試是否包含,合併率基本保持相似。這引發了關於審核者是否重視代理生成的測試,或僅僅不懲罰其缺失的問題。 這項工作揭示了不同代理之間的顯著變化。一些代理的測試採用率高於其他代理。包含測試的 PR 中測試代碼與生產代碼的平衡也因代理而異。 這表明測試能力在代理編碼工具中並不是均勻發展的。有些工具在遵循測試慣例方面表現更好。 隨著公司採用 AI 編碼代理,了解它們的測試行為對於代碼質量至關重要。跳過測試或編寫不充分測試的代理會產生技術負債。這一實證基礎有助於識別哪些代理符合良好的軟體工程實踐,以及在哪些方面需要改進。 論文: 在我們的學院學習如何構建有效的 AI 代理:
87
elvis
20 小時前
代理工具的時代正式來臨! 這意味著你可以期待許多開發者在編寫自己的 Cursor 時感到興奮。 但它不需要是一個 IDE 或完整的 CLI 工具。 一個簡單的 Ralph Wiggum 插件在 Claude Code 中就能給你帶來巨大的優勢。 或者如果你想更好地控制代理的行為,可以構建一個訪問 MCP 驅動的看板的編碼代理。 你會看到許多類似概念的版本在 X 上流傳。 誰能構建出最好的代理工具正在競爭,從中將會出現新的產品和新穎的代理協調器。 但有一件事很重要。使用可自定義和靈活的工具來構建。不要害怕在構建過程中演變你的工作流程和工具。並在過程中記錄所有的知識(即,建立技能和插件)。代理喜歡記憶和上下文,這一點不會很快改變。 感覺事情發展得太快,但這並不重要。更重要的是你要不斷實驗和構建符合你需求的體驗/工作流程。
142
熱門
排行
收藏