Обратная IFEval: новый тест для проверки того, могут ли LLMs разучиться упрямым привычкам обучения и следовать контринтуитивным инструкциям. - 8 типов задач (например, контрфакты, ошибочный текст) - 1k вопросов + 23 области - Показывает когнитивную инерцию LLMs и необходимость адаптивности
17,17K