GLM-4.7 hoạt động khá tốt trên M3 Ultra với mlx-lm, ngay cả ở độ chính xác gần như không mất mát (6-bit ở đây). Nó đã tạo ra trò chơi không gian xâm lược tốt nhất mà tôi từng thấy cho một mô hình cục bộ (còn bao gồm cả hiệu ứng âm thanh!). Tạo ra 6600 token và chạy ở tốc độ 16 tok/s.
Z.ai
Z.ai01:30 23 thg 12
GLM-4.7 đã có mặt! GLM-4.7 vượt trội hơn GLM-4.6 với những cải tiến đáng kể trong lập trình, lý luận phức tạp và sử dụng công cụ, thiết lập các tiêu chuẩn SOTA mã nguồn mở mới. Nó cũng nâng cao hiệu suất trong các tình huống trò chuyện, viết sáng tạo và nhập vai. Mô hình mặc định cho Kế hoạch Lập trình: Thử ngay: Trọng số: Blog Công nghệ:
Đây là một video ghi lại màn hình của trò chơi và lệnh được sử dụng để tạo ra nó: ``` mlx_lm.generate --model mlx-community/GLM-4.7-6bit --prompt "Viết một trang HTML và JavaScript thực hiện trò chơi xâm lược không gian" -m 8192 ```
798