一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

您可以在不進行任何額外訓練的情況下，使 AI 推理速度提高 3 倍。來自 SJTU 和華為的研究人員為此提出了 LoPA！他們的新方法「前瞻性並行解碼」是一個即插即用的技巧。它智能地預測生成多個標記的最佳順序，而不是一個一個地生成，從而解鎖大規模的並行計算。它使 D2F-Dream 模型的輸出每步超過 10 個標記，達到每秒超過 1070 個標記的速度——在編碼 (MBPP) 和數學 (GSM8K) 基準測試中顯著超越其他頂級推理系統。 LoPA：通過前瞻性並行解碼擴展 dLLM 推理論文：代碼：博客：我們的報告： 📬 #PapersAccepted 由 Jiqizhixin 提交