O ile mi wiadomo, Suno znajduje się na granicy Pareto syntez głosu, chociaż jest przeznaczone do muzyki, a nie do mowy. zalety: - możliwość generowania niestandardowych głosów określonych w tekście: opisz wszelkie jakościowe właściwości dotyczące tego, jak brzmi głos i jak jest dostarczana mowa - dobrze radzi sobie z emocjami - mniej płaski i robotyczny niż inne rzeczy, które próbowałem - obsługuje looming (rozgałęzanie i kontynuowanie generowanych próbek z dowolnych punktów) wady: - wolne - brak API - traci spójność w długich tekstach - ma tendencję do przechodzenia w śpiew lub wstawiania instrumentalnych podkładów, nawet jeśli prosisz tylko o mowę (choć możesz eksportować wokalne ścieżki, aby pozbyć się instrumentalnych) więc jest idealne do głośnego czytania krótkich, nieinteraktywnych tekstów lub do tworzenia niestandardowych głosów, które można importować np. do Elevenlabs, w obu przypadkach, jeśli chcesz mieć dużą kontrolę nad brzmieniem i osobowością głosu. Jeśli istnieje lepsza opcja z większą ilością tych zalet lub mniejszą ilością tych wad, chętnie się o tym dowiem.