我声称自回归大语言模型是指数发散的扩散过程。 这里是论点: 设 e 为任何生成的标记退出“正确”答案树的概率。 那么长度为 n 的答案是正确的概率为 (1-e)^n 1/