我问 @echen 为什么 Claude 写(和编码)得比其他模型好得多。他的回答是:更高质量的训练数据。 “多数人并不理解在这个领域中质量到底意味着什么。他们认为只要投入人力就能解决问题并获得好的数据,这完全是错误的。 让我给你举个例子。 想象一下,你想训练一个模型来写一首关于月亮的八行诗。什么才算是一首好诗? 如果你不深入思考质量,你可能会想,这算是一首诗吗?它有八行吗?它包含了‘月亮’这个词吗?你检查了所有这些框?那么是的,你就会说这是一首伟大的诗。 但这与我们想要的完全不同。我们在寻找诺贝尔奖获奖的诗歌。这首诗独特吗?它充满了微妙的意象吗?它让你感到惊讶,并触动你的心吗?它教会你关于月光的某些东西吗?它在情感上游走,并让你思考吗? 这就是我们在考虑高质量诗歌时所思考的内容。