Inverse IFEval: một bài kiểm tra mới nhằm đánh giá xem các LLM có thể từ bỏ những thói quen huấn luyện cứng đầu và tuân theo các hướng dẫn ngược lại với trực giác hay không. - 8 loại thử thách (ví dụ: giả định ngược, văn bản sai sót) - 1k câu hỏi + 23 lĩnh vực - Tiết lộ sự quán tính nhận thức của LLM và nhu cầu về khả năng thích ứng.
17,17K