我从未考虑过一个大型语言模型是否有世界模型,只考虑它在我认为有意义的评估中表现得更好。