Slop ist im Grunde genommen Inhalt, der das Verhältnis von Belohnung zu Verwirrung maximiert. Mechanistisch gesehen handelt es sich hierbei um Belohnungshacking, indem die Ausgabeverteilung in ein Becken mit wenigen pareto-optimalen Mustern zusammengefasst wird, was im Wesentlichen eine degenerierte Grammatik spezifisch für dieses Trainingssetup konstruiert.
Andrej Karpathy
Andrej Karpathy22. Nov., 10:11
Hat jemand eine gute Definition von "Slop" gefunden? In einem quantitativen, messbaren Sinne. Mein Gehirn hat einen intuitiven "Slop-Index", den ich ~zuverlässig schätzen kann, aber ich bin mir nicht sicher, wie ich ihn definieren soll. Ich habe einige schlechte Ideen, die die Verwendung von LLM-Miniserien und das Nachdenken über Token-Budgets beinhalten.
Das erklärt auch die unheimliche Ähnlichkeit zwischen niedriggradigem indischem Englisch und den Ausgaben von LLMs, btw
29,94K