SLOPは基本的に報酬とパープレクシティの比率を最大化するコンテンツです。機械的には、これは出力分布をいくつかのパレート最適パターンを持つ盆地に収縮させることによる報酬ハッキングであり、この訓練セットアップに特化した退化文法を構築するものです。
Andrej Karpathy
Andrej Karpathy11月22日 10:11
「スロップ(汚れたもの)」の良い定義に出会った人はいますか?定量的で測定可能な意味で。私の脳には直感的な「スロップ指数」があり、~確実に推定できますが、それをどう定義すればいいのか分かりません。LLMミニシリーズの使い方やトークン予算の考え方に関わる悪いアイデアもあります。
ちなみに、低レベルのインド英語とLLMの出力が驚くほど似ている理由も説明できます
29.94K