Тестування VibeVoice для одноразового клонування і я не дуже вражений у порівнянні з E2-FF5-TTS: вимагає більше часу для генерації та результат не є переконливим. Я використовував велику модель без Quant. Крім того, моє привітання звучить так, ніби я гоблін з бойового ремесла. Якому з них ви віддаєте перевагу?