Mi se pare ciudat că oamenii cred că cuantizează modelele Frontier – este aproape 100% din punctul meu de vedere că toate rulează deja pe FP4 și orice mai puțin nu este optimizat pentru GPU-urile Nvidia și aș presupune TPU-uri și Trainium etc etc
@mikechrzano mi s-a spus că b300-urile au fost proiectate special pentru nevoile OpenAI de flop-uri FP4 – probabil pentru că acum fac totul în FP4
1,03K