熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
Chamath: 在 AI 中你需要注意的兩個術語是 Prefill 和 Decode
“在接下來的幾年裡,我認為你會聽到很多這兩個術語。”
“第一個術語是 prefill,接下來是 decode。”
“Prefill 和 decode 是兩種非常不同的模型思考方式,以及模型如何通過回答你提出的問題的過程。”
“所以當你向 AI 發送提示時,發生的事情是模型處理它。這被稱為閱讀階段或 prefill。”
“它一次性讀取你的整個提示。然後它進行一系列計算,計算所有單詞之間的關係,並將它們存儲在臨時記憶中。”
“問題是這真的受限於計算能力。因此,它需要巨大的強制計算。而 Nvidia 的 GPU 在這方面表現出色。”
“而他們的架構是為了大規模並行處理而設計的,這使得它們在消化這些長提示方面非常出色。”
“所以問題變得越來越大,Nvidia 完全主導了這一領域。”
“但下一個階段,這個關鍵階段,解碼階段,是寫作階段,對吧?”
“所以模型開始生成回應,你問它一個問題,它的回應是一個標記一個標記地生成。”
“然後為了選擇下一個標記,選擇下一個單詞,它必須回顧它已經說過的所有內容,以免出現幻覺。”
“問題是這在記憶帶寬上受到極大的限制。”
“而在我們的架構中,很久以前,我們從第一天起就做出了這些設計決策。”
“所以我們採取了一種非常不同的架構方法,我們採取了一種非常保守的工藝技術。我們並沒有推動物理的邊界。”
...
熱門
排行
收藏
