Esta arquitectura (qwen3 next) es muy interesante, pero actualmente no estoy convencido de que sea mejor que la arquitectura gemini 2.5 flash longformer + matformer desde el punto de vista de eficiencia/calidad (no hay ejemplos de OSS de esto). Me gustaría pasar un tiempo experimentando con esto, sin embargo.