ต้นฉบับ

wan infinite talk- Audio Driver-KJ

อัปเดตล่าสุด:2025-11-19

- Core concept: An audio-driven lip-sync model using a sparse-frame/keyframe strategy for video dubbing; it preserves identity consistency over long durations and naturally couples head motion, facial expressions, and body pose to the audio. It supports an “image + audio → talking video” mode (starting from a single image) with no upper limit on video length.


- Input/Output: Inputs speech audio (optionally with text/phoneme alignments) and a reference portrait (video or a single image); outputs a talking-face video that closely matches the audio while preserving natural head/expression dynamics and the subject’s identity beyond just the lips.

แปลด้วยคลิกเดียว
ตัวอย่างโหนด 24 nodes
เต็มจอ
คลิกเพื่อโหลดตัวอย่างโหนด
เรียกใช้ (639)
รายการโปรด (17)
ดาวน์โหลด (12)
แชร์
รายละเอียดเวิร์กโฟลว์
ประเภท
กระบวนการทำงาน
การให้คะแนน
4.9
เวลาโพสต์
2025-10-13
สถานะ
สามารถทำงานได้
ข้อมูลโหนด (24)
แสดงความคิดเห็น
0/400
0 ความคิดเห็น