Эта архитектура (qwen3 next) очень интересна, но я в данный момент не уверен, что она лучше архитектуры gemini 2.5 flash longformer + matformer с точки зрения эффективности / качества (нет примеров OSS этого). Тем не менее, я хотел бы потратить некоторое время на эксперименты с этим.