Diese Architektur (qwen3 next) ist sehr interessant, aber ich bin derzeit nicht überzeugt, dass sie besser ist als die Gemini 2.5 Flash Longformer + Matformer-Architektur aus Sicht der Effizienz / Qualität (keine OSS-Beispiele dafür). Ich würde jedoch gerne etwas Zeit damit verbringen, damit zu experimentieren.