このアプリは、LTX2の同期システムを用いて約10秒の短いトーキング動画を生成します。モデルはすでに開発終了しており概ね安定していますが、入力条件が不適切な場合は失敗することがあります。以下のガイドラインに従うと成功率が大きく向上します。 音声は最大30秒まで対応しています(Seaartの制限による)が、20秒を超える動画—特にBGMを組み合わせた場合—は動きが繰り返されやすくなります。最良の結果のため、被写体の顔がはっきり見え、全体の解像感が高い画像を使用してください。意図する動作を明確に指示し、必要に応じて構造化されたキュー形式でタイミングを指定すると、一貫性がさらに向上します。 LTX2は動画の末尾に視覚要素を付加することがあるため、プロンプトの最後に "unprocessed footage" または "clean version" を含めて、この挙動を抑えてください。 1. ミディアムショットの画像を使用してください:腰から上で、顔と肩がはっきり見えるもの。被写体が遠すぎたり、上半身全体を遠景で写していると、失敗率が大幅に上がります。履歴書の証明写真に近い構図をイメージしてください。 2. 現在、音声は10秒に制限されています。より長い音声を試したい場合は、ワークフロー内の LTX2 セクションを確認してください。 現在、音声は10秒に制限されています。より長い音声を試したい場合は、ワークフロー内の LTX2 セクションを確認してください。
