Sinto que é estranho as pessoas acharem que estão quantizando modelos de fronteira - É quase 100% na minha opinião que todos eles já estão rodando em fp4 e qualquer coisa abaixo disso não está otimizada para gpus da nvidia e eu assumiria que também não está para tpus e trainium etc etc
@mikechrzano Disseram-me que os b300s foram especificamente projetados em torno das necessidades da openai em flops fp4 - presumivelmente porque agora fazem tudo em fp4.
1,03K