Evaluările sunt necesare, dar nu suficiente Atât Sonnet 4.5, cât și GLM 4.6 au publicat rezultatele testelor A/B cu experți din diferite categorii pentru noile lor modele