AFAIK, Suno est à la frontière de Pareto de la synthèse vocale, même s'il est destiné à la musique plutôt qu'à la parole. avantages : - capacité à générer des voix personnalisées spécifiées dans le texte : décrire toutes les propriétés qualitatives concernant le son de la voix et la manière dont la parole est délivrée - gère bien l'émotion - moins plate et robotique que d'autres choses que j'ai essayées - prend en charge le looming (ramification et continuation des échantillons générés à partir de points arbitraires) inconvénients : - lent - pas d'API - perd de la cohérence sur de longs textes - a tendance à se mettre à chanter ou à insérer des instrumentaux de fond même si vous demandez uniquement de la parole (bien que vous puissiez exporter des pistes vocales pour vous débarrasser des instrumentaux) donc c'est idéal pour lire à voix haute des textes courts et non interactifs, ou pour créer des voix personnalisées qui peuvent être importées dans par exemple Elevenlabs, dans les deux cas si vous souhaitez un grand contrôle sur le son et la personnalité de la voix. S'il existe une meilleure option avec plus de ces avantages ou moins de ces inconvénients, j'aimerais en être informé.