説明概要
このワークフローは、静止画に命を吹き込み、登場人物に自然な会話をさせるためのマルチモーダルAIアプリです。
男女が写った1枚の静止画と、会話形式のテキストプロンプトを入力するだけで、以下の高度な処理を自動実行します。
多言語音声合成 (Tts): 入力された日本語、英語、中国語、韓国語などのテキストを、話者(男性/女性)の性別に合わせた高品質な音声に変換します。
顔認識と照合: 画像内の「男性の顔」「女性の顔」を自動で判別し、生成された音声と正確に照合します。
完璧なリップシンク動画生成: 各話者のセリフのタイミングに合わせて、画像内の人物の口元をリアルに動かし、2人が会話している動画を完成させます。
✨ 特徴: 誰が話しているかを明示するシンプルなプロンプト形式(例: 男性:〇〇 女性:〇〇)を採用しているため、複雑な設定なしで、ビジネスプレゼンやSNSコンテンツ用のリアルな対話動画をワンクリックで生成可能です。
もっと見る
