🙌Thế giới LLM bất kỳ đến bất kỳ chào đón Ming-flash-omni-preview, với kiến trúc mạnh mẽ 103B-A9B được tối ưu hóa cao nhờ MoE thưa thớt. Nó thiết lập một tiêu chuẩn mới cho hiệu suất omni-modal mã nguồn mở trong việc hiểu và tạo ra: 1. Tạo Hình Ảnh Có Kiểm Soát: Giới thiệu Phân Đoạn Tạo Sinh như Chỉnh Sửa, cho phép kiểm soát chính xác ở mức pixel. Mô hình đạt điểm *0.90* trên tiêu chuẩn GenEval. 2. Hiểu Video Trực Tuyến: Nâng cao khả năng hiểu âm thanh-visual chi tiết và liền mạch. 3. Nhận Diện Địa Phương: Đạt hiệu suất SOTA trong ASR Địa Phương Trung Quốc, thể hiện khả năng thành thạo qua các phương ngữ đa dạng như Hunanese, Cantonese và Minnanese. #OpenSourceModels