Inverse IFEval: um novo teste de bancada para verificar se os LLMs podem desaprender hábitos de treinamento teimosos e seguir instruções contra-intuitivas. - 8 tipos de desafios (por exemplo, contrafactuais, texto falho) - 1k perguntas + 23 domínios - Revela a inércia cognitiva dos LLMs e a necessidade de adaptabilidade