Även några fina förbättringar av CUDA:s backend, inklusive: - Kvantisera och kvantisera matmuler för NVFP4 och MXFP8 med @NasFilippova - Du kan nu 'pip install mlx[cuda13]' för x86 och arm (t.ex. DGX Spark) - Mycket snabbare LLM-prefill och träning tack vare @zcbenz och @angeloskath