원작

WAN2.1 판타지 대화 - 오디오 드라이버 - KJ

마지막 업데이트:2025-11-19

wan_fantasytalking: an audio‑driven video generation model for lip‑synced digital humans. Given a single portrait image plus an audio clip, it produces a high‑fidelity talking video with strict lip synchronization and natural head motion and facial expressions, emphasizing identity consistency and temporal coherence.


Input/Output: single portrait + audio → talking video; focuses on three aspects: lip‑sync accuracy, identity preservation, and natural motion/expressions.


Lip‑sync and temporal modeling: uses audio features (e.g., speech, phonemes, visemes) to drive the mouth and facial regions, jointly coupling head motion and expressions to avoid the “lips‑only” uncanny effect.

원클릭 번역
노드 미리보기 23 nodes
전체 화면
노드 미리보기를 로드하려면 클릭하세요
실행 (116)
수집 (6)
다운로드 (1)
공유하기
워크플로우 세부 정보
유형
워크플로우
평가
5
게시 날짜
2025-10-14
상태
실행 가능
노드 정보 (23)
댓글
0/400
0개의 댓글