来看 Index TTS2 和 VibeVoice-7B 哪个效果好? 需要注意的是,生成长音频的时候,这两个模型都会抖动,所以解决方案是,可以多生成一块,然后反复生成把有瑕疵的部分裁剪掉。 这两个 workflow 都是开源的: VibeVoice: IndexTTS2: (作者:Producing_It @ reddit)