É impressionante como saturamos rapidamente os benchmarks para cada modalidade. Ficou bastante claro quando isso aconteceu com o texto - você tinha que usar um LLM por alguns dias antes de ter uma noção real da qualidade, mesmo que tecnicamente fosse o #1. Agora isso está acontecendo com imagens e vídeos!