Inverse IFEval: un nou banc care testează dacă LLM-urile pot dezvăța obiceiurile de antrenament încăpățânate și pot urma instrucțiuni contraintuitive. - 8 tipuri de provocări (de exemplu, contrafactuale, text defectuos) - 1k Qs + 23 domenii - Dezvăluie inerția cognitivă a LLM-urilor și nevoia de adaptabilitate