As avaliações são necessárias, mas não suficientes Tanto o Sonnet 4.5 quanto o GLM 4.6 publicaram resultados de testes A/B com especialistas em diferentes categorias para seus novos modelos