slop es básicamente contenido que maximiza la relación recompensa-perplejidad. Mecanísticamente, esto es un hackeo de recompensa mediante la colapsación de la distribución de salida en una cuenca con unos pocos patrones Pareto-óptimos, esencialmente construyendo una gramática degenerada específica para esta configuración de entrenamiento.
Andrej Karpathy
Andrej Karpathy22 nov, 10:11
¿Alguien ha encontrado una buena definición de "slop"? En un sentido cuantitativo y medible. Mi cerebro tiene un "índice de slop" intuitivo que puedo ~estimar de manera confiable, pero no estoy seguro de cómo definirlo. Tengo algunas ideas malas que involucran el uso de miniseries de LLM y pensar en presupuestos de tokens.
Esto también explica la extraña similitud entre el inglés indio de baja calidad y las salidas de LLM, por cierto.
29,95K