热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
slop 基本上是最大化奖励与困惑度比率的内容。从机制上讲,这是一种通过将输出分布压缩到具有少数帕累托最优模式的盆地来进行的奖励黑客,实质上是在为这个训练设置构建一种退化的语法。

2025年11月22日
Has anyone encountered a good definition of “slop”. In a quantitative, measurable sense. My brain has an intuitive “slop index” I can ~reliably estimate, but I’m not sure how to define it. I have some bad ideas that involve the use of LLM miniseries and thinking token budgets.
这也解释了低级印度英语和大型语言模型输出之间的惊人相似性,顺便提一下。
53
热门
排行
收藏
