Thrive Capital(@ThriveCapital年)のパートナー、フィリップ・クラーク(@PJClark)は、OpenAI、カーソル、物理知能、そして半導体に関する自身のバックグラウンドを活かし、AI開発の現状に関する3つの大きなポイントを概説しています。 1.) AIのブレークスルーは直線的ではありません。それらはシリコンのように建築的な波のように現れます。 フィリップの半導体類推は、AIの進歩をハードウェアのようなパラダイムシフトの連続として再構築しています。 ある経路が限界に達すると(シングルコア→マルチコア、事前訓練→ポストトレーニング)、新しいアーキテクチャが生まれます。AIは段階的な調整で進化しているわけではありません。構造的な再発明を通じて進歩しています。 2.) 強化学習は(現時点では)次のアーキテクチャ時代です。 フィリップは強化学習をポストトレーニングの後継として位置づけています。すなわち、最適化ではなく新たな基盤です。しかし重要なのは、これが最後ではないことを強調している。 ハードウェアがシングルコアからマルチコア、GPUへと飛躍し続けたように、AIも複数のパラダイム波を経験し、それぞれが新たな性能の上限を切り開くでしょう。強化学習は単に次の波であり、最終波ではありません。 3.) OpenAIの堀はモデルではありません。それは次のパラダイムを発見し続ける能力です。 フィリップは、製品の上方にあるというコアな利点を主張しています。大規模モデルにおけるすべての主要なアーキテクチャ的ブレークスルーはOpenAIから生まれています。 彼らの擁護性は、繰り返し「次のもの」を発明しつつ、前のものを同時に実用化することにあります。どの業界においても稀な組み合わせであり、ましてや連続的な跳躍によって定義される業界ではなおさらです。 . . . モリー:「Sourceryを誇りを持ってスポンサーしているスポンサーの一つが@turingcomで、AI研究の側面、つまりAI研究加速器(CEOにはインタビューも@jonsidd)に触れることができました。モデルの手伝いもします。そして現在、彼らはここ45〜2四半期で模倣データや合成データから強化学習への大きなシフトに気づいています。 技術的な面や応用面でどう見ているのか、気になります。」 フィリップ:「AIはある意味で半導体のようなものだと思います。もし半導体に戻るなら、それが大きな基準です。より良いパフォーマンスを目指して多くの波が起きているという意味で、 半導体に関しては、かつてはシングルコア半導体がありました。その後、基本的にシングルコアからそれ以上の性能を絞り出せなくなったため、マルチコアに移行しました。そしてGPUの話に進みました。そして、AIでも非常に似た現象が見られていて、GPT-1、GPT-2、GPT-3の時代にプリトレーニングから始めました。それがGPT-4にたどり着きました。 その後、ChatGPTには多くのポストトレーニング技術、教師ありの微調整や人間のフィードバックによる強化学習を使い始めました。これがモデルが異星の知性から、より役立つ助手として機能することを可能にしたのです。そして今、その成果から得られる手軽な成果の多くが絞り出されてしまった(まだやるべきことは多いでしょうが)、強化学習はAIの次の大きなパラダイムシフトとなり、多くのリソースがそこに向かう方向となっています。...