سونيت 4.5 خرج! إنه النموذج الحدودي الأكثر توافقا حتى الآن. الكثير من التقدم بالنسبة إلى Sonnet 4 و Opus 4.1!
من الجدير بالملاحظة أن Sonnet 4.5 تعبر عن الوعي القياسي أكثر بكثير من النماذج السابقة. هل هذا يبطل نتائجنا؟ لقد أجرينا تدقيقا بناء على الأجزاء الداخلية للنموذج والإجابة هي "ربما قليلا ، ولكن في الغالب لا".
1. عند مراجعة النصوص يدويا التي يسميها النموذج على أنها مزيفة ، فقد حكمنا عليها على أنها مزيفة بشكل واضح ، ولا يعطينا أي سبب للاعتقاد بأن النموذج خارق للإنسان في الوعي القياسي.
2. لقد وجهنا مع العديد من ميزات SAE المتعلقة بالوعي بالتقييم. يمكن أن يؤدي ذلك إلى تقليل درجات محاذاة النموذج ، ولكن في الغالب عن طريق جعله أكثر فائدة فقط بدلا من جعله خادعا. بالنسبة لجميع متجهات التوجيه التي جربناها ، كان Sonnet 4.5 لا يزال أكثر محاذاة من Sonnet 4
ومع ذلك ، فإن الوعي بالتقييم مهم جدا لمراقبة المضي قدما!
لقد حصلنا على قيمة كبيرة من التدقيق الآلي (الرسم البياني الشريطي في المنشور الأول) ، مما يوفر حلقة ملاحظات سريعة حول التخفيف من المحاذاة. كانت هذه أيضا المرة الأولى التي نقوم فيها بمراجعة نموذج إنتاج يعتمد على الأجزاء الداخلية للنموذج. تطبيقات عملية لأبحاث interp!
أنا فخور حقا بالفريق ، كان من الرائع أن أرى كيف اجتمع كل هذا معا!
‏‎65.8‏K