Nhập hình ảnh để tạo video xoạc chân.
Ngôn ngữ văn bản và ngôn ngữ của mô hình giọng nói phải nhất quán, ví dụ: văn bản tiếng Anh đi kèm với mô hình giọng nói tiếng Anh.
Chọn mô hình giọng nói:
'A' => Tiếng Anh Mỹ
“B” => Tiếng Anh Anh
'j' => Tiếng Nhật
'Z' => Tiếng Trung
Hậu tố "f" cho giọng nữ, hậu tố "m" cho giọng nam, ví dụ: ZF_xiaoxiao (nữ), ZM_yunxi (nam).
