Slop é basicamente conteúdo que maximiza a relação recompensa-perplexidade. Mecanicamente, isso é hacking de recompensas por meio do colapso da distribuição de saída em uma bacia com alguns padrões ótimos de Pareto, basicamente construindo uma gramática degenerada específica para esse sistema de treinamento.
Andrej Karpathy
Andrej Karpathy22 de nov. de 2025
Has anyone encountered a good definition of “slop”. In a quantitative, measurable sense. My brain has an intuitive “slop index” I can ~reliably estimate, but I’m not sure how to define it. I have some bad ideas that involve the use of LLM miniseries and thinking token budgets.
Isso também explica a semelhança impressionante entre o inglês indiano de baixa qualidade e as saídas do LLM, aliás
62