なぜClaude@echen他のモデルよりもずっと上手く書く(そしてコーディング)できるのか尋ねました。彼の答えは「より高品質なトレーニングデータ」でした。 「この分野の品質が何を意味するのか、ほとんどの人は理解していません。彼らは問題に人を投げつければ良いデータが得られると思っていますが、それは全くの誤りです。 例を挙げましょう。 例えば、モデルに月についての8行の詩を書かせる訓練をさせたいと想像してください。なぜそれが良い詩なのでしょうか? 質について深く考えなければ、「これは詩なのか?」と思うでしょう。8行入っているのですか?そこに「月」という言葉が含まれていますか?これらの項目に全部チェックした?だから、はい、確かにあなたはそれが素晴らしい詩だと言います。 でもそれは私たちの望むものとは全く違う。ノーベル賞受賞詩を探しています。この詩はユニークなのでしょうか?微妙なイメージが満載ですか?驚きや心を揺さぶる?月明かりの本質について何か教えてくれますか?感情を描き出しますか?考えさせられますか? それが私たちが高品質な詩を考えるときに考えていることです。」