這個架構(qwen3 next)非常有趣,但我目前並不相信它在效率/質量方面比gemini 2.5 flash longformer + matformer架構更好(沒有oss示例)。不過,我想花一些時間來嘗試一下這個。