热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我问 @echen 为什么 Claude 写(和编码)得比其他模型好得多。他的回答是:更高质量的训练数据。
“多数人并不理解在这个领域中质量到底意味着什么。他们认为只要投入人力就能解决问题并获得好的数据,这完全是错误的。
让我给你举个例子。
想象一下,你想训练一个模型来写一首关于月亮的八行诗。什么才算是一首好诗?
如果你不深入思考质量,你可能会想,这算是一首诗吗?它有八行吗?它包含了‘月亮’这个词吗?你检查了所有这些框?那么是的,你就会说这是一首伟大的诗。
但这与我们想要的完全不同。我们在寻找诺贝尔奖获奖的诗歌。这首诗独特吗?它充满了微妙的意象吗?它让你感到惊讶,并触动你的心吗?它教会你关于月光的某些东西吗?它在情感上游走,并让你思考吗?
这就是我们在考虑高质量诗歌时所思考的内容。
热门
排行
收藏
