一個大型語言模型的「氛圍」比它的智力重要得多。除非你的模型能真的從帽子裡變出一隻兔子,否則沒有人會在乎你的基準測試。 只要讓你的模型像成年人一樣跟我對話,而不是像一個十歲小孩的夏令營指導員。