Ця архітектура (qwen3 next) дуже цікава, але я в даний час не впевнений, що вона краща, ніж архітектура Gemini 2.5 Flash Longformer + Maformer з точки зору ефективність/якість (прикладів цього немає OSS), я хотів би витратити деякий час, щоб повозитися з цим.