今天和大家分享一个可以让图片人物开口讲话的软件hallo,这个软件可以根据提供的音频素材和人物图片制作成一个视频,视频中的人物开口讲话的语音就是音频素材的内容,且人物口型与音频同步,本软件为免费软件,原项目地址:https://github.com/fudan-generative-vision/hallo,软件效果如图:
这个软件对电脑配置要求比较高,建议显卡显存在10G以上的用户体验。
使用时需要注意:
对于源人物图像:
- 图片需要被裁剪成正方形。
- 人脸部应是主要焦点,占图像的 50%-70%。
- 面部应朝前,旋转角度小于 30°。
对于驱动音频:
- 它必须是 WAV 格式。
- 确保声音清晰。
我制作了Windows版的一键启动整合包,有感兴趣的可以自己去体验一下。
音频驱动口型图片转视频软件hallo一键启动整合包下载链接: