Så vidt jeg vet, befinner Suno seg på Pareto-fronten av stemmesyntese, selv om det er ment for musikk og ikke tale. Fordeler: - mulighet til å generere tilpassede stemmer spesifisert i tekst: beskriv eventuelle kvalitative egenskaper ved hvordan stemmen høres ut og hvordan talen leveres - håndterer følelser godt - mindre flatt og robotaktig enn andre ting jeg har prøvd - støtter looming (forgrening og videregående genererte prøver fra vilkårlige punkter) Ulemper: - sakte - ingen API - mister koherens over lange tekster - har en tendens til å bryte ut i sang eller sette inn bakgrunnsinstrumentaler selv om du kun ber om tale (selv om du kan eksportere vokalstammer for å fjerne instrumentaler) Så det er ideelt for å lese høyt, korte, ikke-interaktive tekster, eller for å lage egendefinerte stemmer som kan importeres til for eksempel Elevenlabs, i begge tilfeller hvis du vil ha mye kontroll over lyden og personligheten til stemmen. Hvis det finnes et bedre alternativ med flere av disse fordelene eller færre ulemper, vil jeg gjerne vite om det.