L'attention multi-tête dans les LLM, expliquée visuellement :