He afirmado que los LLM autorregresivos son procesos de difusión exponencialmente divergentes. Este es el argumento: Sea e la probabilidad de que cualquier token generado salga del árbol de respuestas "correctas". Entonces la probabilidad de que una respuesta de longitud n sea correcta es (1-e)^n 1/