一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

Sholto Douglas (Anthropic): "在过去的一年里，强化学习终于让我们能够将反馈循环转化为一个模型，这个模型在特定领域至少与最优秀的人类一样出色。你可以在数学和竞赛编程中看到这一点，这两个领域最适合这种方法——模型迅速变得非常擅长竞赛数学和竞赛编程。竞赛编程和数学之间没有本质上的区别。只是它们比其他领域更适合强化学习。但重要的是，它们表明模型没有智力上的天花板。只要有合适的反馈循环，它们就能够进行非常复杂的推理。因此，我们认为同样的方法可以推广到人类智力努力的所有其他领域，只要有合适的反馈循环，这些模型将在特定领域至少与最优秀的人类一样出色。一旦你有了在某个领域至少与最优秀的人类一样出色的东西，你就可以并行运行1000个，或者以100倍的速度运行，你就会得到一个在这一条件下比任何人类都要聪明得多的东西。这完全不考虑是否可能创造出比人类更聪明的东西。这带来的影响是相当惊人的，对吧？在接下来的2到3年里，考虑到合适的反馈循环、合适的计算能力等，我们认为整个AI行业有望创造出在大多数计算机相关任务上至少与大多数人类一样有能力的东西，可能在许多我们最优秀的科学家所在的领域也能达到同样的水平。它会有起伏，会有一些它无法做到的例子。但世界将会改变。 ……我认为这值得从屋顶上大声呼喊——伙计们，我们能测量的任何东西似乎都在迅速改善。那在2或3年后会把我们带到哪里？我不能确定。但我认为值得将其纳入世界观中，因为我们有相当大的机会获得AGI。"