นี่คือแอปที่ใช้เทคโนโลยี Lip-sync ของ LTX2 เพื่อสร้างวิดีโอการพูดความยาวประมาณ 10 วินาที โมเดลนี้ยังอยู่ในการพัฒนา ดังนั้นแม้ความผิดพลาดเพียงเล็กน้อยก็อาจทำให้ล้มเหลวทันที แต่เมื่อเทียบกับโมเดลอื่นแล้วถือว่าค่อนข้างเสถียร ผมจึงตัดสินใจปล่อยออกมา หากคุณทำตามเงื่อนไขด้านล่าง อัตราความสำเร็จจะเพิ่มขึ้นอย่างมาก
1. ใช้ภาพระดับปานกลาง (Medium-shot): ตั้งแต่เอวขึ้นไป โดยเห็นใบหน้าและไหล่อย่างชัดเจน หากภาพอยู่ไกลเกินไปหรือแสดงร่างกายส่วนบนทั้งหมดจากระยะไกล อัตราความล้มเหลวจะเพิ่มขึ้นอย่างมาก ให้คิดถึงองค์ประกอบที่คล้ายกับรูปถ่ายในเรซูเม่
2. ขณะนี้เสียงจำกัดอยู่ที่ 10 วินาที หากคุณต้องการลองใช้เสียงที่ยาวขึ้น ให้ตรวจสอบส่วน LTX2 ในเวิร์กโฟลว์ของผม
ขณะนี้เสียงจำกัดอยู่ที่ 10 วินาที หากคุณต้องการลองใช้เสียงที่ยาวขึ้น ให้ตรวจสอบส่วน LTX2 ในเวิร์กโฟลว์ของผม
