Me parece raro que la gente piense que están cuantizando modelos Frontier; en mi opinión, es casi 100% que ya funcionan en FP4 y que lo que sea menos no está optimizado para GPUs Nvidia, y supongo que TPUs, Trainium, etc., etc
@mikechrzano me dijeron que los B300 fueron diseñados específicamente para las necesidades de OpenAI de flops FP4, supongo que porque ahora hacen todo en FP4
1.01K