Acho plausível que a Anthropic esteja muito atrás da China (especificamente DeepSeek/Moonshot/Xiaomi/Qwen) em eficiência de atenção. Eles são conservadores de modelos, a vantagem vem da escala (Dario é obcecado) e da qualidade dos dados. O mesmo valia para xAI até Fast Fast. Talvez a OpenAI também.
Ankith 🐋/acc
Ankith 🐋/acc6 de jan., 15:19
Muitos simplesmente não conseguem acreditar que custa apenas $2 por 1 milhão enquanto vendem por $25. Você percebe que, se os custos reais deles forem muito maiores que 2 dólares, então eles estão muito atrás da China? Muito atrás das pessoas QUE LITERALMENTE PUBLICAM SUAS PESQUISAS E CÓDIGOS Eles estão na frente, são < 2 dólares
Mais precisamente, acho que o Claude 4.5 está tecnicamente no nível ≈MiMo, atrás do Kimi-Linear Dito isso, hardware melhor + escala resultam em um modelo simples, mais forte e possivelmente mais barato de atender do que a fronteira chinesa. Se eles não conseguem fazer nem isso, são apenas ngmi
66