He afirmado que los LLMs auto-regresivos son procesos de difusión que divergen exponencialmente. Aquí está el argumento: Sea e la probabilidad de que cualquier token generado salga del árbol de respuestas "correctas". Entonces, la probabilidad de que una respuesta de longitud n sea correcta es (1-e)^n 1/