Esta arquitectura (qwen3 a continuación) es muy interesante, pero actualmente no estoy convencido de que sea mejor que la arquitectura gemini 2.5 flash longformer + matformer desde el punto de vista de la eficiencia / calidad (no hay ejemplos oss de esto) me gustaría pasar algún tiempo jugando con esto, aunque