de vibevoice testen voor de one-shot cloning & ik ben niet zo onder de indruk vergeleken met e2-ff5-tts: het kost meer tijd om te genereren & het resultaat is niet overtuigend. ik heb het grote non-quant model gebruikt. ook klinkt mijn hallo alsof ik een Warcraft-goblin ben. welke vind jij beter?