説明概要
此工作流程結合 、为静止图像赋予生命、用于让登场人物进行自然对话的多模态AI应用程序。
一张包含男女的静止图像和、只需输入对话形式的文本提示、自动执行以下高级处理。
多语言语音合成 (語音合成): 输入的日语、英語、中文、韩语等文本、話者(男?/女?)转换为与?别相匹配的高质量语音。
人脸识别和比对: 图像中的「男?的面孔」「女?的面孔」自动进行判断、将生成的语音与图像精确对应。
完美的嘴型同步视频生成: 根据每个说话者台词的时间、图像中的人物の口元をリアルに動かし、完成两人对话的视频。
✨ 特徴: 简单的提示格式来指明是谁在说话(例: 男?:〇〇 女?:〇〇)采用了、无需复杂设置、一键生成适用于商业演示或社交媒体内容的真实对话视频。
更多
