本次和大家分享另一个非常强大的数字人软件Sonic,这个软件可以通过一段音频驱动,将图片转为视频,让图片中的人物开口讲话,讲话内容就是音频内容。

Sonic软件说明
提供一段不超过10秒的音频和一张图片,Sonic就可以让图片中的人物开口讲话,包括动漫图片人物,讲话内容就是这个音频素材的内容,而且音频口型同步,非常的逼真自然。
Sonic整合包使用说明
当前为最新版的一键启动整合包,无需配置环境,解压即用。首先到网盘内将压缩包软件下载到本地电脑上并解压。由于完整模型文件总共要37G,太大了无法压缩上传到网盘。其中31G模型文件可以在阿里平台高速下载,所以我做了个下载程序,这其中的31G模型文件可以自动下载。
双击【启动软件.exe】,第一次运行的话先点击按钮下载模型,总共要下载31G的文件,所以请耐心等待,等到终端窗口中输出模型下载完成的时候,模型就是下载完成了,就可以点击按钮启动软件了。
稍等一会软件会打开webUI界面,等待时间由电脑配置决定。
软件整体操作非常简单,上传图片素材,上传音频素材,点击合成按钮即可。
合成视频时间由音频时长、图片尺寸、电脑配置等因素决定。
视频教程和效果演示:https://nuowa.net/1732
注意事项
音频时长请勿超过10秒
只支持windows10或11
建议英伟达显卡显存6G以上用户体验
建议图片尺寸为512或768,图片尺寸太大处理时间就会太长
Sonic一键启动整合包下载链接
夸克网盘:https://pan.quark.cn/s/1911a87d8d92
UC网盘(不限速)扫码下载↓:
