CosyVoice是目前比较火的TTS文字转语音工具,具有合成情感语音的能力,语音合成效果非常好。不光可以文字转语音,还可以实现快速声音克隆,3秒声音素材即可克隆音色,而且对电脑配置要求不是很高,一般电脑都能带动。是一款比较不错的免费的语音合成工具。之前和大家分享过一次CosyVoice,语音合成详细介绍可以看之前的文章《3秒极速声音克隆软件CosyVoice整合包下载,声音复刻情感语音合成TTS文字转语音工具》,上次分享的整合包没有训练音色模型的功能,这次把这个功能添加进去了。只需要3-10秒的音频素材,即可快速训练出自己的音色模型,同时自己训练的音色模型也支持Instruct模型情感语音合成。
主要讲一下如何创建自己的音色模型,以便用自己的音色进行情感语音合成。
先到我网盘里将CosyVoice.7z压缩包下载到电脑上解压,这个是主程序,是更新到了最新版本的,以前分享的那个版本有点旧。然后将pretrained_models.7z模型压缩包下载到CosyVoice文件夹内解压,这样程序就准备完成了。
准备一段3-10的纯人声wav音频文件,文件夹的名字就是你想要生成的模型的名字,比如你想生成的音色模型名为LiuYifei,那么文件夹名字就需要命名为LiuYifei,将wav音频文件放进去。
在音色训练工具里选择这个文件夹,或是将这个文件夹拖到程序窗口中,然后点击训练音色模型按钮即可开始训练自己的音色模型,等到终端窗口中提示:训练完成,按任意键继续…就说明训练完成了
使用前先处理一个问题,打开如下路径:C:\Users\你的电脑用户名\.cache\modelscope,将文件夹内的ast_indexer文件删除,然后再启动软件,否则软件会报错
重新启动软件webUI界面,就可以看到自己的声音模型了。你可以使用你自己的声音在Instruct模型中进行情感语音合成了。
CosyVoice情感语音合成软件及音色模型训练工具整合包下载链接: