Inverse IFEval: een nieuwe benchmark die test of LLM's hardnekkige trainingsgewoonten kunnen afleren en tegenintuïtieve instructies kunnen volgen. - 8 uitdagingstypes (bijv. tegenfeitelijkheden, gebrekkige tekst) - 1k vragen + 23 domeinen - Onthult de cognitieve traagheid van LLM's en de noodzaak voor aanpassingsvermogen.