Questa è un'app che utilizza il lip-sync di LTX2 per generare video parlanti di circa 10 secondi. Il modello è ancora in fase di sviluppo, quindi anche piccoli disallineamenti ne causano il fallimento immediato, ma è relativamente stabile rispetto ad altri, quindi lo sto rilasciando comunque. Se segui le condizioni seguenti, il tasso di successo migliora notevolmente.
1. Usa un'immagine a piano medio: dalla vita in su, con viso e spalle chiaramente visibili. Se l'immagine è troppo lontana o mostra l'intero busto da lontano, il tasso di fallimento aumenta drasticamente. Pensa a una composizione simile a una foto da curriculum.
2. L'audio è attualmente limitato a 10 secondi. Se vuoi provare un audio più lungo, controlla la sezione LTX2 nel mio workflow.
L'audio è attualmente limitato a 10 secondi. Se vuoi provare un audio più lungo, controlla la sezione LTX2 nel mio workflow.
