LTX2 のリップシンクを利用して約 10 秒のしゃべる動画を生成するアプリです。モデルはまだ開発中のため、わずかな不一致でもすぐに失敗しますが、他と比較して比較的安定しているためリリースすることにしました。以下の条件を守ることで、成功率が大幅に向上します。
1. 中景画像を使用する:腰から上で、顔と肩がはっきりと見えるもの。画像が遠すぎたり、遠くから上半身全体が写っていると失敗率が劇的に上がります。履歴書写真のような構図を意識してください。
2. 音声は現在 10 秒に制限されています。より長い音声を試したい場合は、私のワークフローの LTX2 セクションを確認してください。
音声は現在 10 秒に制限されています。より長い音声を試したい場合は、私のワークフローの LTX2 セクションを確認してください。
