Aleguei que os LLMs Auto-Regressivos são processos de difusão que divergem exponencialmente. Aqui está o argumento: Seja e a probabilidade de que qualquer token gerado saia da árvore de respostas "corretas". Então, a probabilidade de que uma resposta de comprimento n seja correta é (1-e)^n 1/