IFEval inverso: un nuevo banco que prueba si los LLM pueden desaprender hábitos de entrenamiento obstinados y seguir instrucciones contrarias a la intuición. - 8 tipos de desafíos (por ejemplo, contrafácticos, texto defectuoso) - 1k Qs + 23 dominios - Revela la inercia cognitiva de los LLM y la necesidad de adaptabilidad
17.17K