1.

人物照片(单人,清晰,正面)

2.

用于合成视频的音频素材

3.

照片驱动模型

4.

输出画面分辨率