Questa architettura (qwen3 next) è molto interessante, ma attualmente non sono convinto che sia migliore dell'architettura gemini 2.5 flash longformer + matformer dal punto di vista dell'efficienza / qualità (non ci sono esempi oss di questo) mi piacerebbe passare un po' di tempo a sperimentare con questo però.