自然主義的なビデオ刺激に対するfMRI脳の反応を予測することは、ほんの数のデータと、最も残念なことに、数行のPythonで信じられないほどうまくいくというのは、少し悲しいことです 私の言っていることが分かりますよね。たとえば、コードは本質的に読みやすく単純です(Torchなどを使用したAVGトランスフォーマーモデルの場合です) TorchとPythonがCUDAカーネルよりも優れたAPIであるように、魅力の一部がほとんど取り除かれます 「かなり単純で超高速な数学」を呼び出すシンプルなASSコード+大量のデータで十分です 唯一の複雑な部分は、ML コンパイラとそのターゲットのアーキテクチャです これらすべては完全に自明でよく知られており、それは実現でも何でもありませんが、脳の反応を予測することが 500 loc の Python と 2025 年の一部のデータであることは面白いと思います (ラヴクラフトの現代の GPU と ML コンパイラの複雑さのおかげで、非常にきれいに隠されています)
AI at Meta
AI at Meta8月11日 19:20
🏆 Meta FAIR の Brain & AI チームが、権威ある Algonauts 2025 脳モデリング コンペティションで 1 位を獲得したことを発表できることを嬉しく思います。 同社の 1B パラメーター モデルである TRIBE (Trimodal Brain Encoder) は、複数のモダリティ、皮質領域、および個人にわたる刺激に対する脳の反応を予測するようにトレーニングされた最初のディープ ニューラル ネットワークです。このアプローチは、テキスト(Llama 3.2)、音声(SeamlessのWav2Vec2-BERT)、ビデオ(V-JEPA 2)など、Metaのいくつかの基礎モデルの事前トレーニング済み表現を組み合わせて、Courtois NeuroModプロジェクトによって取得された映画に対する非常に大量(被験者あたり80時間)の時空間fMRI脳応答を予測します コードをダウンロードします。 論文を読む: 課題について学ぶ: データをダウンロードします。
はっきり言っておきますが、私はそれが悲しいと言っているのではなく、脳が「特別」であるとか、私は文句を言っているのです bc python は遅滞した英語のように見え、クールではありません 私はk-complexity/compression/brainはコンピューターの若者です、脳の反応を予測することが可能であることにショックを与えたり悲しんだりしません、私はそれがtardo-english Pythonで書かれていることを悲しく思います、そしてそれが理にかなっていることを悲しく思います
25.64K