我觉得人们认为他们在量化前沿模型是很奇怪的——在我看来,几乎可以肯定它们都已经在运行 fp4,任何低于这个的都没有针对 nvidia gpu 进行优化,我想 tpus 和 trainium 等等也是如此。
@mikechrzano 我被告知 b300s 是专门围绕 openai 对 fp4 flops 的需求设计的——显然是因为他们现在都在使用 fp4 进行一切。
1.01K