Ta architektura (qwen3 next) jest bardzo interesująca, ale obecnie nie jestem przekonany, że jest lepsza od architektury gemini 2.5 flash longformer + matformer pod względem efektywności / jakości (brak przykładów OSS tego). Chciałbym jednak spędzić trochę czasu na eksperymentowaniu z tym.