Bence insanların Frontier modellerini kuantize ettiğini düşünmesi garip - bence hepsi zaten FP4'te çalışıyor ve daha azı Nvidia GPU'lar için optimize edilmemiş ve TPU, Trainium vs. gibi şeyler varsayıyorum
@mikechrzano bana b300'lerin özellikle openai'nin FP4 flop ihtiyaçları için tasarlandığı söylendi - muhtemelen artık fp4'te her şeyi yaptıkları için
1,02K