Ik vind het vreemd dat mensen denken dat ze frontier-modellen aan het quantiseren zijn - Het is naar mijn mening bijna 100% zeker dat ze allemaal al op fp4 draaien en alles minder is niet geoptimaliseerd voor nvidia gpus en ik neem aan tpus en trainium enzovoort enzovoort
@mikechrzano Mij is verteld dat b300s specifiek zijn ontworpen rond de behoeften van openai voor fp4 flops - vermoedelijk omdat ze nu alles in fp4 doen
1,02K