Acho que não entendemos o comportamento de MoEs tão grandes (especialmente com arquiteturas avançadas pós-DSMoE). Mas sabemos que o escalonamento é bom, com 0,8% mesmo com ≈28 bilhões no total. E maneiras inteligentes de explorar a escassez além do "grão mais fino" tornam-se possíveis. Eu digo que 1% em 10T é *conservador*.