Frontierモデルが量子化されていると思い込んでいるのは変だと思います。個人的にはほぼ100%、すでにFP4で動いているので、それ以下はnvidia GPUやTPUやTrainiumなどに最適化されていないと思います。
@mikechrzano、b300はOpenAIのFP4の失敗作のニーズに合わせて特別に設計されていると聞きました。おそらく今はすべてFP4でやっているからでしょう
1K