Bence insanların Frontier modellerini kuantize ettiğini düşünmesi garip - bence hepsi zaten FP4'te çalışıyor ve daha azı Nvidia GPU'lar için optimize edilmemiş ve TPU, Trainium vs. gibi şeyler varsayıyorum
Bilginiz olsun, Nous Portal API'si artık 4 kat daha büyük varsayılan oran sınırına sahip, üzerinde çalıştığımız tüm iyileştirmelerin daha büyük duyurusu yakında ^_^ gelecek