研究發布: 📘從計算到智能:基於強化學習的去中心化AI投資地圖 🧠 訓練範式 預訓練建立基礎;後訓練正成為主要戰場。強化學習(RL)正在成為更好推理和決策的引擎,後訓練的成本通常約為總計算的5-10%。它的需求——大規模推出、獎勵信號生成和可驗證訓練——自然地映射到去中心化網絡和區塊鏈原語,以進行協調、激勵和可驗證的執行/結算。
🌐 終局 Web3 重新定義了智慧的生產——解鎖低成本的全球計算部署,並通過社區治理實現主權對齊——將貢獻者從標記勞動轉變為數據股權持有者,並在訓練者、對齊者和用戶之間更公平地分配價值。
🧭 市場地圖 本報告對 RL × Web3 在三個領域進行基準測試:算法(@NousResearch/DisTrO)、系統(@PrimeIntellect, @gensynai, @Gradient_HQ)和機制設計(@grail_ai/Bittensor, @FractionAI_xyz)。
⚙️ 核心邏輯: “解耦–驗證–激勵” 🔌 解耦:將計算密集型、通信輕量的推出外包給全球長尾GPU;將帶寬密集的參數更新保留在集中式/核心節點上。 🧾 可驗證性:使用ZK或學習證明(PoL)來強制開放網絡中的誠實計算。 💰 激勵:代幣化機制調節計算供應和數據質量,減少獎勵遊戲/過擬合。
29