跳轉至主要內容
行情
掃鏈
追蹤
信號
跟單
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+3.39%
USELESS
-0.99%
IKUN
-5.64%
gib
+9.54%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+4.03%
ALON
-0.4%
LAUNCHCOIN
+4.75%
GOONC
+6.76%
KLED
+4.93%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.93%
Boopa
-0.65%
PORK
0.00%
主頁
Artificial Analysis
獨立分析 AI 模型和託管供應商 - 為您的用例選擇最佳模型和 API 供應商
查看原文
Artificial Analysis
12月19日 06:15
Agent Skills 現在在 Stirrup 中得到支持 - 我們的輕量級框架,用於構建代理 在 Stirrup 中使用 Agent Skills 就像指定技能文件的目錄一樣簡單(通常只是 markdown 文件)。Agent Skills 是一組指令、腳本和資源的文件夾,代理可以根據需要加載,以更準確和高效地執行任務。您可以創建特定於所需用例的技能,以為您的代理提供額外的程序知識或指令。 只需創建您的技能 markdown 文件,或複製您與 Claude Code 或 Codex 一起使用的現有技能文件,今天就開始在 Stirrup 中使用技能吧。 以下是 Stirrup 的鏈接
64
Artificial Analysis
12月19日 00:11
MBZUAI的基礎模型研究所發布了K2-V2,這是一個70B的推理模型,在我們的開放指數中並列第一,並且是阿聯酋在我們排行榜上的第一個模型 📖 開放性並列領導者:K2-V2與OLMo 3 32B Think一起位於人工分析開放指數的頂端——我們新發布的、標準化的、獨立評估的AI模型開放性衡量標準,涵蓋可用性和透明度。MBZUAI超越了模型權重的開放訪問和許可——他們提供了對訓練前和訓練後數據的完全訪問。他們還以寬鬆的Apache許可證發布訓練方法和代碼,允許任何目的的免費使用。這使得K2-V2成為開源社區的寶貴貢獻,並允許更有效的微調。請參見下面的鏈接! 🧠 強大的中型(40-150B)開放權重模型:K2-V2在我們的智力指數中以70B的規模獲得46分,並具有高推理模式。這使得它高於Llama Nemotron Super 49B v1.5,但低於Qwen3 Next 80B A3B。該模型在指令跟隨方面具有相對優勢,在IFBench中得分為60% 🇦🇪 我們排行榜上的第一個阿聯酋參賽者:在大量美國和中國模型的海洋中,K2-V2作為我們排行榜上阿聯酋的第一個代表而脫穎而出,也是中東地區在以色列的AI21實驗室之後的第二個參賽者。K2-V2是我們基準測試的第一個MBZUAI模型,但該實驗室之前已發布了特別關注語言表示的模型,包括埃及阿拉伯語和印地語 📊 降低推理模式減少令牌使用和幻覺:K2-V2有3種推理模式,高推理模式使用約130M的令牌來完成我們的智力指數。然而,中等模式將令牌使用量減少了約6倍,智力指數僅下降6分。有趣的是,較低的推理模式在我們的知識和幻覺指數AA-Omniscience中得分更高,因為它們的幻覺傾向較低
19.82K
1
熱門
排行
收藏