LFM2.5 má poměrně rychlý předplňovací výkon na notebooku M5 s mlx-lm. Model s plnou přesností zpracuje výzvu k tokenu 28k za < 6 sekund (>5k tok/s). Mohl by to být velmi pěkný model pro malá zařízení s nervovými akcelerátory.