El slop es básicamente contenido que maximiza la relación recompensa-perplejidad. Mecánicamente, esto es hacking de recompensas mediante el colapso de la distribución de salida en una cuenca con algunos patrones óptimos de Pareto, construyendo esencialmente una gramática degenerada específica para esta configuración de entrenamiento.
Andrej Karpathy
Andrej Karpathy22 nov 2025
Has anyone encountered a good definition of “slop”. In a quantitative, measurable sense. My brain has an intuitive “slop index” I can ~reliably estimate, but I’m not sure how to define it. I have some bad ideas that involve the use of LLM miniseries and thinking token budgets.
Esto también explica la asombrosa similitud entre el inglés indio de baja calidad y las salidas de LLM, por cierto
62