Cette architecture (qwen3 next) est très intéressante, mais je ne suis actuellement pas convaincu qu'elle soit meilleure que l'architecture gemini 2.5 flash longformer + matformer en termes d'efficacité / qualité (pas d'exemples oss de cela). J'aimerais passer un peu de temps à expérimenter avec ça cependant.