Тепер можна запускати виробничий формат перетворення тексту в мовлення з затримкою менше 200 мс. Відкрита система TTS щойно поставляла трансляцію в реальному часі з аудіовиходом 150 мс. Він підтримує нульове клонування голосу на дев'яти мовах і багатьох діалектах. Bi-streaming дозволяє вести голос у реальному часі Він транслює текст, а аудіо — назовні. Немає повного буферизації речень. Затримка залишається низькою без погіршення якості звуку. Це підходить для живих агентів, помічників та інтерактивних додатків. • Вхід тексту та аудіовихід виконуються одночасно • Затримка від кінця до кінця досягає ~150 мс • Працює зі стандартними стеками виведення GPU Нульове клонування голосу працює на різних різних мовах Він клонує голоси без спеціального навчання для динаміка. Одного короткого довідкового аудіо достатньо. Той самий голос передається між мовами та акцентами. • Підтримуються дев'ять основних мов • Крослінгвальний синтез залишається послідовним • Схожість динаміків залишається стабільною Він додає тонкий контроль для виробництва Ви можете контролювати вимову, швидкість, емоції та гучність. Цифри та символи нормалізуються автоматично. Він працює як сервіс, так і всередині контейнерів. ...