testando o vibevoice para a clonagem de uma só vez e não estou tão impressionado em comparação com o e2-ff5-tts: leva mais tempo para gerar e o resultado não é convincente. usei o modelo grande não quantificado. também faz com que meu olá soe como se eu fosse um goblin de warcraft. qual você prefere?