Мені здається дивним, що люди думають, ніби квантують моделі Frontier — на мою думку, майже на 100%, вони всі вже працюють на fp4, а все менше не оптимізоване для nvidia GPU, і я припускаю, що це TPU та Trainium тощо
@mikechrzano мені сказали, що b300 спеціально розроблені з урахуванням потреб OpenAI у fp4-флопах — ймовірно, тому що зараз вони роблять усе в FP4
1,01K