No me gustan estos puntos de referencia. Me hubiera encantado ver alguna comparación entre Sonnet 4.5, GPT-4 y Grok-4