Bu tepede ölmeye hazırım: En iyi ses modelleri, anahtar varlıklarla en iyi doğruluğa sahip modellerdir, WER (Kelime Hata Oranı) için optimize edilenler değil. Çoğu konuşma-metne sağlayıcı WER için optimize eder, ancak üretim uygulamalarında WER o kadar da önemli değildir. Müşterinin adını, telefon numarasını ya da sadece harf harf yazdığı sokak adresini kaçırırsanız kelimelerin %95'ini doğru yapmak işe yaramaz. Gladia ekibi çok havalı bir kıyar aldı: • 1.000+ çağrı merkezi konuşması • Bol arka plan gürültüsü • İsimleri, telefon numaralarını, adresleri, konumları vb. çıkarmaya odaklanın. Gladia modeli, diğer tüm son teknoloji modelleri %17'ye kadar geride bıraktı! Bu modelleri kullanan şirketler için tam da önemli olan veriler. Bunu yanlış yaparsanız, sonraki her şey kırılır. Bahsetmeye değer birkaç başka nokta: • Kısmi ölçülerde gecikme: < 150ms • 100+ dil destekleniyor • Dinamik dil algılama • Genel WER %5,97 Ses modeli kullananlar için kesinlikle kontrol etmeye değer: Bu gönderide benimle iş birliği yaptıkları için Gladia ekibine teşekkürler.