Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Voor zover ik weet, staat Suno op de Pareto-grens van spraaksynthetisatie, ook al is het bedoeld voor muziek in plaats van spraak.
voordelen:
- mogelijkheid om aangepaste stemmen te genereren die in tekst zijn gespecificeerd: beschrijf alle kwalitatieve eigenschappen over hoe de stem klinkt en hoe de spraak wordt geleverd
- gaat goed om met emotie - minder vlak en robotachtig dan andere dingen die ik heb geprobeerd
- ondersteunt looming (vertakken en voortzetten van gegenereerde samples vanaf willekeurige punten)
nadelen:
- traag
- geen API
- verliest coherentie over lange teksten
- heeft de neiging om in zang uit te breken of achtergrondinstrumenten in te voegen, zelfs als je alleen om spraak vraagt (hoewel je vocale stems kunt exporteren om van instrumentals af te komen)
dus het is ideaal voor het hardop voorlezen van korte, niet-interactieve teksten, of voor het creëren van aangepaste stemmen die kunnen worden geïmporteerd in bijvoorbeeld Elevenlabs, in beide gevallen als je veel controle wilt over het geluid en de persoonlijkheid van de stem.
Als er een betere optie is met meer van deze voordelen of minder van deze nadelen, zou ik het graag willen weten.
Boven
Positie
Favorieten
