Nguyên bản

Wan2.1 Fantasytalking-Audio Driver-KJ

Cập Nhật Gần Nhất:2025-11-19

wan_fantasytalking: an audio‑driven video generation model for lip‑synced digital humans. Given a single portrait image plus an audio clip, it produces a high‑fidelity talking video with strict lip synchronization and natural head motion and facial expressions, emphasizing identity consistency and temporal coherence.


Input/Output: single portrait + audio → talking video; focuses on three aspects: lip‑sync accuracy, identity preservation, and natural motion/expressions.


Lip‑sync and temporal modeling: uses audio features (e.g., speech, phonemes, visemes) to drive the mouth and facial regions, jointly coupling head motion and expressions to avoid the “lips‑only” uncanny effect.

Dịch chỉ với một cú nhấp
Xem trước nút 23 nodes
Toàn màn hình
Nhấp để Tải Xem trước Nút
Chạy (116)
Yêu thích (6)
Tải xuống (1)
Chia sẻ
Chi tiết quy trình làm việc
Loại
Luồng Công việc
Đánh giá
5
Thời gian đăng tải
2025-10-14
Trạng thái
Có Thể Chạy Được
Thông tin nút (23)
Bình luận
0/400
Tổng cộng 0 bình luận