원작

원 인피니트 토크 - 오디오 드라이버 - KJ

마지막 업데이트:2025-11-19

- Core concept: An audio-driven lip-sync model using a sparse-frame/keyframe strategy for video dubbing; it preserves identity consistency over long durations and naturally couples head motion, facial expressions, and body pose to the audio. It supports an “image + audio → talking video” mode (starting from a single image) with no upper limit on video length.


- Input/Output: Inputs speech audio (optionally with text/phoneme alignments) and a reference portrait (video or a single image); outputs a talking-face video that closely matches the audio while preserving natural head/expression dynamics and the subject’s identity beyond just the lips.

원클릭 번역
노드 미리보기 24 nodes
전체 화면
노드 미리보기를 로드하려면 클릭하세요
실행 (639)
수집 (17)
다운로드 (12)
공유하기
워크플로우 세부 정보
유형
워크플로우
평가
4.9
게시 날짜
2025-10-13
상태
실행 가능
노드 정보 (24)
댓글
0/400
0개의 댓글