測試 vibevoice 的一次性克隆,我對比 e2-ff5-tts 並不太滿意:生成所需時間更長,結果也不令人信服。 我使用的是大型非量化模型。還有,它讓我的「你好」聽起來像是一個魔獸世界的哥布林。 你更喜歡哪一個?