Jag har hävdat att auto-regressiva LLM:er är exponentiellt divergerande diffusionsprocesser. Här är argumentet: Låt e vara sannolikheten att en genererad token lämnar trädet med "korrekta" svar. Då är sannolikheten att ett svar med längden n är korrekt (1-e)^n 1/