这个架构(qwen3 next)非常有趣,但我目前并不相信它在效率/质量方面比gemini 2.5 flash longformer + matformer架构更好(没有oss示例)。不过,我想花一些时间来尝试一下这个。