Mi sembra strano che la gente pensi di quantizzare i modelli di frontiera - È quasi certo al 100% secondo me che stiano già tutti funzionando su fp4 e qualsiasi cosa inferiore non è ottimizzata per le gpu nvidia e presumo anche per tpus e trainium ecc ecc
@mikechrzano Mi è stato detto che i b300s sono stati progettati specificamente attorno alle esigenze di openai in termini di fp4 flops - presumibilmente perché ora fanno tutto in fp4.
1K