Original

Imagem para vídeo WAN2.1 Fantasytalking-Audio Driver-KJ

Última atualização:2025-11-19

wan_fantasytalking: an audio‑driven video generation model for lip‑synced digital humans. Given a single portrait image plus an audio clip, it produces a high‑fidelity talking video with strict lip synchronization and natural head motion and facial expressions, emphasizing identity consistency and temporal coherence.


Input/Output: single portrait + audio → talking video; focuses on three aspects: lip‑sync accuracy, identity preservation, and natural motion/expressions.


Lip‑sync and temporal modeling: uses audio features (e.g., speech, phonemes, visemes) to drive the mouth and facial regions, jointly coupling head motion and expressions to avoid the “lips‑only” uncanny effect.

Tradução com um clique
Pré-visualização de Nós 23 nodes
Tela Cheia
Clique para Carregar Visualização do Nó
Executar (116)
Favoritar (6)
Download (1)
Compartilhar
Detalhes do fluxo de trabalho
Tipo
Fluxo de trabalho
Avaliação
5
Tempo de Publicação
2025-10-14
Status
Executável
Informações do Nó (23)
Comentário
0/400
comentário(s)