我确实认为会有那么一天,当一个大型语言模型能够通过推理和外部工具进行自我验证。如果它通过接触世界进行自己的实验,从中获得验证反馈,并测试其理论,它可以自我验证很多。 我认为我们还没有完全达到那个阶段,但……