-Tú - un graduado de CS aleatorio con 0 idea de cómo funcionan los LLM - cansarse de que la gente se mantenga en contacto con palabras grandes y GPU pequeñas - Decide ir al modo monje completo - 2 años después puedo explicar los mecanismos de atención en las fiestas y arruinarlos - Aquí está el mapa de conocimiento prohibido - de arriba a abajo, cómo funcionan *realmente* los LLM - empezar por el principio - Tokens de → de texto - Tokens → incrustaciones - ahora eres un número de coma flotante en el espacio 4D - vibrar en consecuencia - incrustaciones posicionales: - Absoluto: "Soy la posición 5" - rotativo (RoPE): "soy una onda sinusoidal" - Coartada: "Escalo la atención a distancia como un hater" - atención es todo lo que necesitas - Autoatención: "¿A quién puedo prestar atención?" - Multihead: "¿Qué pasa si hago eso 8 veces en paralelo?" - QKV: consulta, clave, valor - suena como una estafa criptográfica - en realidad el núcleo de la inteligencia -Transformadores: - Toma tus entradas - aplastarlos a través de las capas de atención...