Giải thích trực quan về attention đa đầu trong LLMs: