Xiaomi vừa ra mắt MiMo-V2-Flash, một mô hình lý luận trọng số mở 309B đạt điểm 66 trên Chỉ số Phân tích Trí tuệ Nhân tạo. Sự ra mắt này nâng Xiaomi lên ngang hàng với các phòng thí nghiệm mô hình AI hàng đầu khác. Những điểm nổi bật trong việc đánh giá: ➤ Điểm mạnh trong Sử dụng Công cụ Tác động và Toán học Cạnh tranh: MiMo-V2-Flash đạt 95% trên τ²-Bench Telecom và 96% trên AIME 2025, cho thấy hiệu suất mạnh mẽ trong các quy trình làm việc sử dụng công cụ tác động và lý luận toán học theo kiểu cạnh tranh. MiMo-V2-Flash hiện đang dẫn đầu trong danh mục τ²-Bench Telecom trong số các mô hình đã được đánh giá. ➤ Cạnh tranh về chi phí: Bộ đánh giá Phân tích Trí tuệ Nhân tạo đầy đủ chỉ tốn 53 đô la để chạy. Điều này được hỗ trợ bởi mức giá cạnh tranh cao của MiMo-V2-Flash là 0,10 đô la cho mỗi triệu đầu vào và 0,30 đô la cho mỗi triệu đầu ra, khiến nó đặc biệt hấp dẫn cho các triển khai nhạy cảm về chi phí và khối lượng sản xuất quy mô lớn. Điều này tương tự như DeepSeek V3.2 (tổng chi phí 54 đô la để chạy), và thấp hơn nhiều so với GPT-5.2 (tổng chi phí 1.294 đô la để chạy). ➤ Sử dụng token cao: MiMo-V2-Flash thể hiện sự sử dụng token và độ dài văn bản cao so với các mô hình khác trong cùng một cấp độ trí tuệ, sử dụng khoảng 150 triệu token lý luận trong bộ Phân tích Trí tuệ Nhân tạo. ➤ Trọng số mở: MiMo-V2-Flash có trọng số mở và có 309B tham số với 15B hoạt động trong thời gian suy diễn. Trọng số được phát hành theo giấy phép MIT, tiếp tục xu hướng các phòng thí nghiệm mô hình AI Trung Quốc mở mã nguồn cho các mô hình tiên tiến của họ. Xem bên dưới để biết thêm phân tích:
MiMo-V2-Flash thể hiện sức mạnh đặc biệt trong việc sử dụng công cụ agentic và Toán Cạnh tranh, đạt 95% trên τ²-Bench Telecom và 96% trên AIME 2025. Điều này đưa nó vào danh sách những mô hình hoạt động tốt nhất trong các danh mục này.
MiMo-V2-Flash là một trong những mô hình tiết kiệm chi phí nhất cho trí tuệ của nó, chỉ có giá 0,10 USD cho mỗi triệu token đầu vào và 0,30 USD cho mỗi triệu token đầu ra.
MiMo-V2-Flash đã tạo ra khoảng 150 triệu token lý luận trong khi chạy bộ đánh giá Phân tích Nhân tạo, khiến nó trở thành một trong những mô hình tiêu tốn token nhiều nhất được thử nghiệm - điều này có ảnh hưởng đến độ trễ và làm giảm một số lợi thế về giá của nó.
Điểm số MiMo-V2-Flash là -62 trên Chỉ số AA-Omniscience, chủ yếu do tỷ lệ ảo giác tương đối cao.
Kết quả cá nhân từ bộ đánh giá Chỉ số Trí tuệ Phân tích Nhân tạo của chúng tôi:
Xem Phân tích Nhân tạo để biết thêm chi tiết và tiêu chuẩn của MiMo-V2-Flash
7,67K