Testing VibeVoice for one-shot kloning og jeg er ikke så imponert sammenlignet med E2-FF5-TTS: tar mer tid å generere og resultatet er ikke overbevisende. Jeg har brukt den store ikke-kvantmodellen. Det får også hei til å høres ut som om jeg er en warcraft-nisse. hvilken du foretrekker?