Prise en charge des invites multilingues, capable de générer un son haute fidélité, couvrant une variété de types tels que la voix humaine, l'ASMR, les effets sonores, la musique, etc., améliorant considérablement la qualité esthétique et la capacité de suivre des instructions complexes, et optimisant la cohérence de l'ID et la précision du contrôle de la vidéo générée à partir d'images. Choisissez librement la résolution ; chaque résolution a un prix différent.
