IFEval inverso: uma nova bancada testando se os LLMs podem desaprender hábitos de treinamento teimosos e seguir instruções contra-intuitivas. - 8 tipos de desafio (por exemplo, contrafactuais, texto falho) - 1k Qs + 23 domínios - Revela a inércia cognitiva e a necessidade de adaptabilidade dos LLMs