オリジナル

WAN2.1 ファンタジートーキング-オーディオドライバー-KJ

最終更新:2025-11-19

wan_fantasytalking: an audio‑driven video generation model for lip‑synced digital humans. Given a single portrait image plus an audio clip, it produces a high‑fidelity talking video with strict lip synchronization and natural head motion and facial expressions, emphasizing identity consistency and temporal coherence.


Input/Output: single portrait + audio → talking video; focuses on three aspects: lip‑sync accuracy, identity preservation, and natural motion/expressions.


Lip‑sync and temporal modeling: uses audio features (e.g., speech, phonemes, visemes) to drive the mouth and facial regions, jointly coupling head motion and expressions to avoid the “lips‑only” uncanny effect.

翻訳
ノードプレビュー 23 nodes
全画面表示
クリックしてノードプレビューを読み込む
創作 (116)
お気に入り (6)
ダウンロード (1)
シェア
ワークフロー詳細
タイプ
ワークフロー
評価
5
投稿日時
2025-10-14
状態
実行可能
ノード情報 (23)
コメント
0/400
コメント:0件