Käynnistän "SVG kissa ratsastamassa lohikäärmeellä" -testini. (inspiraationa @simonw:n pelican riding bicycle benchmark) Claude Opus 4.5 saa Gemini 3 Pron ja GPT 5.1 Pron sekä Grok 4.1:n näyttämään leluilta.
En voi uskoa, että GPT 5.1 Pro ajatteli 7m 40 sekuntia tähän paskaan 🤣.
Alan kyseenalaistaa tämän benchmarkin arvon, SVG muuttuu paljon joka kerta kun ajan sitä! Toinen yritys ja Gemini 3 Pro loi tämän yllättävän söpön anime-tyylisen lohikäärmeen.
3,86K