Các tác nhân LLM gặp khó khăn trong các nhiệm vụ dài. Đây là lúc kỹ thuật ngữ bối cảnh thực sự quan trọng. Các tác nhân có thể lý luận và sử dụng công cụ, nhưng các hoạt động kéo dài gây ra sự phát triển bối cảnh không giới hạn và tích lũy lỗi. Các giải pháp phổ biến như nén bối cảnh hoặc gợi ý tăng cường truy xuất buộc phải đánh đổi giữa độ trung thực thông tin và sự ổn định lý luận. Nghiên cứu mới này giới thiệu InfiAgent, một khung làm cho bối cảnh lý luận của tác nhân luôn được giới hạn chặt chẽ bất kể nhiệm vụ kéo dài bao lâu. Ý tưởng là ngoại hóa trạng thái bền vững vào một trừu tượng tập trung vào tệp. Thay vì nhồi nhét mọi thứ vào bối cảnh, tác nhân duy trì một không gian làm việc của các tệp tồn tại qua các bước. Tại mỗi điểm quyết định, nó tái tạo bối cảnh từ một ảnh chụp trạng thái không gian làm việc cộng với một khoảng thời gian cố định của các hành động gần đây. Điều này tách biệt thời gian nhiệm vụ khỏi kích thước bối cảnh. Dù nhiệm vụ mất 10 bước hay 1000, bối cảnh lý luận vẫn giữ nguyên độ dài. Điều này thật tuyệt vì phương pháp này không yêu cầu tinh chỉnh cụ thể cho nhiệm vụ. Tác nhân hoạt động giống nhau bất kể lĩnh vực. Các thí nghiệm trên DeepResearch và một nhiệm vụ tổng quan tài liệu 80 bài báo cho thấy InfiAgent với mô hình mã nguồn mở 20B cạnh tranh với các hệ thống sở hữu lớn hơn. Nó duy trì độ bao phủ dài hạn cao hơn đáng kể so với các tiêu chuẩn tập trung vào bối cảnh. Nhiệm vụ tổng quan tài liệu 80 bài báo đặc biệt đáng chú ý. Đó chính xác là loại nhiệm vụ kéo dài mà các tác nhân truyền thống tích lũy lỗi và mất dấu những gì họ đã làm. Việc ngoại hóa trạng thái dựa trên tệp của InfiAgent ngăn chặn sự suy giảm này. Bài báo: Học cách xây dựng các tác nhân AI hiệu quả trong học viện của chúng tôi: