Original

WAN2.1 Fantasytalking-Audio Driver-KJ

Renouvellement Récent:2025-11-19

wan_fantasytalking: an audio‑driven video generation model for lip‑synced digital humans. Given a single portrait image plus an audio clip, it produces a high‑fidelity talking video with strict lip synchronization and natural head motion and facial expressions, emphasizing identity consistency and temporal coherence.


Input/Output: single portrait + audio → talking video; focuses on three aspects: lip‑sync accuracy, identity preservation, and natural motion/expressions.


Lip‑sync and temporal modeling: uses audio features (e.g., speech, phonemes, visemes) to drive the mouth and facial regions, jointly coupling head motion and expressions to avoid the “lips‑only” uncanny effect.

Traduire en un clic
Aperçu des Nœuds 23 nodes
Plein écran
Cliquez pour charger l'aperçu du nœud
Créer (116)
Favoris (6)
Téléchargement (1)
Partager
Détails du flux de travail
Type
Flux de Travail
Évaluation
5
Temps de Publication
2025-10-14
Statut
Exécutable
Informations sur les nœuds (23)
Commentaire
0/400
0 commentaire(s)