Lançando meu benchmark "SVG de um gato montando um dragão". (inspirado no Pelican Riding Bike Benchmark de @simonw) Claude Opus 4.5 faz Gemini 3 Pro & GPT 5.1 Pro e Grok 4.1 parecerem brinquedos.
Não acredito que o GPT 5.1 Pro pensou em 7m 40s para essa merda 🤣
Estou começando a questionar o valor desse benchmark, o SVG muda muito toda vez que eu o rodo! Mais uma tentativa e Gemini 3 Pro gerou esse dragão surpreendentemente fofo no estilo anime.
3,86K