ショルト・ダグラス(アンソロピック): 「昨年、RLはついにフィードバックループを取り、狭い領域で特定のことにおいて少なくとも最高の人間と同等の優れたモデルに変えることを可能にしました。そして、数学と競合コードでは、これに対して最も修正可能な2つの領域であり、モデルは急速に信じられないほど有能な競争数学者や競争プログラマーになりつつあります。 競技コードと数学には本質的に何も違いはありません。ただ、他のどのドメインよりもRLに本当に[より]順応しているだけです。しかし重要なことは、モデルに知的上限がないことを示しています。彼らは、適切なフィードバックループがあれば、非常に難しい推論を行うことができます。したがって、同じアプローチは、適切なフィードバックループが与えられた場合、これらのモデルは、少なくとも特定のことにおいて最高の人間と同じくらい優れたものになる、人間の知的努力の他のすべての領域に一般化されると考えています。そして、少なくとも最高の人間と同等の性能を発揮したら、1,000 個を並行して実行したり、100 倍の速さで実行したりすることができ、その条件だけでも、どの人間よりも大幅に賢いものを手に入れることができます。そして、これは人間よりも賢いものを作ることが可能かどうかを完全に脇に置いています。 この意味はかなり驚くべきものですよね?今後2、3年で、適切なフィードバックループや適切なコンピューティングなどがあれば、AI業界全体として、ほとんどのコンピューターに面したタスクで、少なくともほとんどの人間と同等の能力を持ち、おそらくその分野の最高の科学者の多くと同じくらい優れたものを生み出すことができると考えています。鋭くてとがったものになり、できない例もあるでしょう。しかし、世界は変わるでしょう。 ...これは屋上から少し泣く価値があると思います - 皆さん、私たちが測定できるものはすべて本当に急速に改善されているようです。 それは2年、3年後に私たちをどこへ連れて行くのでしょうか?確かなことは言えません。しかし、AGIを獲得する可能性がかなり高いという世界観を組み込む価値はあると思います。」