Fick kontinuerlig batchning att fungera med SSM:er i mlx-lm. Här är fyra OpenCode-agenter som kör Nvidias Nemotron Nano samtidigt på 64GB M4 Max. Detta är en bra modell för mindre maskiner eftersom det är MoE + hybrid attention (liten cache).