Tôi đã hỏi @echen tại sao Claude viết (và lập trình) tốt hơn nhiều so với các mô hình khác. Câu trả lời của anh ấy: dữ liệu đào tạo chất lượng cao hơn. "Hầu hết mọi người không hiểu chất lượng thực sự có nghĩa là gì trong lĩnh vực này. Họ nghĩ rằng bạn chỉ cần ném người vào một vấn đề và có được dữ liệu tốt, và điều đó hoàn toàn sai. Hãy để tôi đưa ra một ví dụ. Hãy tưởng tượng bạn muốn đào tạo một mô hình để viết một bài thơ tám dòng về mặt trăng. Điều gì làm cho nó trở thành một bài thơ hay? Nếu bạn không suy nghĩ sâu sắc về chất lượng, bạn sẽ như thế này, đây có phải là một bài thơ không? Nó có chứa tám dòng không? Nó có chứa từ mặt trăng không? Bạn kiểm tra tất cả những điều này? Vậy thì vâng, chắc chắn, bạn nói rằng đó là một bài thơ tuyệt vời. Nhưng điều đó hoàn toàn khác với những gì chúng tôi muốn. Chúng tôi đang tìm kiếm thơ đoạt giải Nobel. Liệu bài thơ này có độc đáo không? Nó có đầy hình ảnh tinh tế không? Nó có làm bạn ngạc nhiên và chạm đến trái tim bạn không? Nó có dạy bạn điều gì đó về bản chất của ánh sáng mặt trăng không? Nó có chơi với cảm xúc và khiến bạn suy nghĩ không? Đó là những gì chúng tôi đang nghĩ đến khi nghĩ về một bài thơ chất lượng cao."