Saya tidak pernah berpikir tentang apakah LLM memiliki model dunia, hanya apakah itu lebih baik di Eval yang menurut saya berarti