Kiến trúc này (qwen3 next) rất thú vị, nhưng hiện tại tôi không bị thuyết phục rằng nó tốt hơn kiến trúc gemini 2.5 flash longformer + matformer từ góc độ hiệu suất / chất lượng (không có ví dụ oss nào về điều này) tôi muốn dành một chút thời gian để thử nghiệm với điều này.