Esta arquitetura (qwen3 next) é muito interessante, mas atualmente não estou convencido de que seja melhor do que a arquitetura gemini 2.5 flash longformer + matformer do ponto de vista de eficiência / qualidade (sem exemplos oss disso). Gostaria de passar algum tempo experimentando com isso, no entanto.