預測 fMRI 大腦對自然視頻刺激的反應有點悲傷的是,只需一些數據和幾行 Python 代碼就能做到這一點。 你知道我在說什麼嗎?就像,這段代碼可讀性強且簡單(對於使用 torch 等的平均變壓器模型也是如此)。 像 torch 和 python 這樣的 API 在 cuda 核心上實在是太好了,幾乎去掉了一些魅力。 簡單的代碼調用「相當簡單且非常快速的數學」+ 大量數據就足夠了。 唯一複雜的部分是 ML 編譯器及其目標架構。 這一切都是顯而易見且眾所周知的,這不是一種領悟或其他什麼,我只是覺得有趣的是,預測大腦反應在 2025 年只需要 500 行 Python 代碼和一些數據(多虧了現代 GPU 和 ML 編譯器的 Lovecraftian 複雜性被如此巧妙地隱藏起來)。
AI at Meta
AI at Meta8月11日 19:20
🏆 我們很高興地宣布,Meta FAIR 的腦與人工智慧團隊在享有盛譽的 Algonauts 2025 腦建模競賽中獲得第一名。 他們的 1B 參數模型 TRIBE(三模態腦編碼器)是第一個訓練用於預測腦對刺激反應的深度神經網絡,涵蓋多種模態、皮層區域和個體。這種方法結合了來自 Meta 的幾個基礎模型的預訓練表示——文本(Llama 3.2)、音頻(Seamless 的 Wav2Vec2-BERT)和視頻(V-JEPA 2)——以預測大量(每個主題 80 小時)由 Courtois NeuroMod 項目獲得的電影的時空 fMRI 腦反應。 下載代碼: 閱讀論文: 了解挑戰: 下載數據:
聊天只是為了澄清,我不是說這很悲傷,因為大腦是「特別」的或什麼的,我是在抱怨因為 Python 看起來像是愚蠢的英語,並且不酷。 我是一個 k-複雜性/壓縮/大腦是電腦的傢伙,預測大腦反應是可能的,這並不讓我感到震驚或悲傷,我感到悲傷的是它是用愚蠢的英語 Python 寫的,並且這是有道理的。
25.64K