人们普遍认为我们无法将思考外包给这些代理,但我想对此提出一些反驳。当我真正辩论另一方时,我对此并不自信。外面有很多文献尚未被充分探索,新的信息在推理时很容易收集,还有可以从其他领域的工作中获得灵感的工作。尝试新事物的人才数量受到时间/智力/动机的瓶颈。对我来说,这似乎现在主要是一个金钱问题,而这实际上是一个计算问题。 如果我可以在2026年做一个预测,那就是会对此进行修正。我们将相信这些模型能够以更高的程度发明新事物——也许它们会超越我们。
一个有趣的观察是,在较长的时间范围内,代理本身会产生大量有价值的信息(通常是通过工作验证的结果),我发现这对于模型利用这些新信息进一步探索非常有趣。有时,它会产生人类尚未见过的结果或信息,或者在信息被错误报告的情况下重新检查信息。
157