Tvrdil jsem, že auto-regresivní LLM jsou exponenciálně divergující difúzní procesy. Zde je argument: Nechť e je pravděpodobnost, že jakýkoli vygenerovaný token opustí strom "správných" odpovědí. Pak je pravděpodobnost, že odpověď o délce n je správná (1-e)^n 1/