Thí nghiệm mới của chúng tôi sử dụng phiên bản nâng cao của Gemini 2.5 Deep Think để xác minh một cách nghiêm ngặt các tài liệu khoa học máy tính lý thuyết. 97% người tham gia thử nghiệm, tác giả cho #STOC2026, cho rằng phản hồi rất hữu ích để phát hiện lỗi và cải thiện độ rõ ràng. Thêm thông tin tại: