今天和大家分享一个非常热门的TTS文字转语音软件GPT-SoVITS,这个软件不光可以实现语音合成,而且还可以声音克隆,仅使用1分钟音频数据样品即可克隆,功能非常强大
2025-06-22 更新v2ProPlus版

GPT-SoVITS软件介绍及版本特点:
- 零样本 TTS:输入 5 秒的声音样本并体验即时文本到语音的转换。
- 少量样本 TTS:仅使用 1 分钟的训练数据对模型进行微调,以提高语音相似度和真实感。
- 跨语言支持:使用不同于训练数据集的语言进行推理,目前支持英语、日语、韩语、粤语和中文。
- WebUI 工具:集成工具包括语音伴奏分离、自动训练集分割、中文 ASR 和文本标注,帮助初学者创建训练数据集和 GPT/SoVITS 模型。
GPT-SoVITS-V1实现了:
由参考音频的情感、音色、语速控制合成音频的情感、音色、语速
可以少量语音微调训练,也可不训练直接推理
可以跨语种生成,即参考音频(训练集)和推理文本的语种为不同语种
GPT-SoVITS-V2新增特点:
对低音质参考音频合成出来音质更好
底膜训练集增加到5k小时,zero shot性能更好音色更像,所需数据集更少
增加韩粤两种语言,中日英韩粤5个语种均可跨语种合成
更好的文本前端:持续迭代更新。V2中英文加入多音字优化。
V3版
新功能:
- 音色相似度更高,需要更少的训练数据就能逼近目标说话人(直接使用基础模型,不进行微调,音色相似度就有显著提升)。
- GPT模型更加稳定,重复和遗漏更少,更容易生成情感表达更丰富的语音。
V4版
新功能:
- 版本 4 修复了版本 3 中因非整数倍上采样而产生的金属音损问题,并原生输出 48k 音频,避免了声音低沉(而版本 3 仅原生输出 24k 音频)。作者认为版本 4 可以直接替代版本 3,但仍需进一步测试
V2Pro
新功能:
- VRAM 使用率比 v2 略高,性能超越 v4,但硬件成本和速度与 v2 相同。
2. v1/v2 和 v2Pro 系列拥有相同的特性,而 v3/v4 也具有类似的特性。对于音质一般的训练集,v1/v2/v2Pro 可以提供不错的效果,但 v3/v4 则不然。此外,v3/v4 的合成音调和时值更偏向参考音频,而非整体训练集。
GPT-SoVITS整合包使用说明
首先上传3-10秒的参考音频。
然后在参考音频的文本里输入音频样本的文字内容,不输入音频文本的话,效果会差些,尽量输入。
然后输入需要合成的文本,点击合成语音按钮。
其它参数可自行测试效果
视频教程及效果演示:https://nuowa.net/2017
注意事项
使用前先更新英伟达显卡驱动到最新版本。
支持英伟达50系列显卡
建议英伟达显卡显存不低于4G
软件运行路径中不要有非英文字符和空格,待使用音频素材同样注意
TTS文字转语音合成及声音克隆软件GPT-SoVITS整合包下载链接:
https://pan.quark.cn/s/3d4628397997
GPT-SoVITS本地电脑安装部署教程
相关推荐
最近更新

凡人修仙传动画韩立高清图片壁纸素材AI绘画图集
恭迎韩天尊! 祝贺韩天尊顺利结婴! 热门国漫凡人修仙传动画已经更新了5年了,最新一集,主人公韩立顺利结婴,成为一名元婴修士。我属于是比较喜欢看动漫的,看过的动漫估计没过百也得大几十了,热门国漫大多都看过。凡人修仙传算是最喜欢的动漫之一,韩立...

凡人修仙传动画紫灵高清图片壁纸素材AI绘画图集,AI国漫女神系列
凡人修仙传动画乱星海第一美女紫灵是大家非常喜欢的一个角色,动画人物造型精美,是众多女性角色中最受欢迎之一,热度极高。很多人喜欢收集紫灵的图片,但是视频里截图的话可能截不到喜欢的图,下面分享一些紫灵的AI绘画图片素材,图片都是SD生成的,都是...

凡人修仙传动画宋玉高清图片壁纸素材AI绘画图集,AI国漫女神系列
凡人修仙传动画里宋玉是大家比较喜欢的一个角色,动画人物造型精美,当前热度极高。虽然凡人修仙传原著里只是韩老魔的弟子,但是很多短视频创作者非常能整活,已经把宋玉纳入韩老魔后宫了。很多人喜欢收集宋玉的图片,但是视频里截图的话可能截不到喜欢的图,...

凡人修仙传动画人物梅凝高清壁纸素材AI绘画图片,AI国漫女神系列
有些人比较喜欢凡人修仙传动画里梅凝这个角色,视频里截图的话可能截不到喜欢的图,下面分享一些梅凝的AI绘画图片素材,图片都是SD生成的,都是高清大图,非凡人修仙传动画视频截图。部分梅凝图片如下: 图片及模型文件下载链接: https://pa...

凡人修仙传动画人物范静梅高清壁纸素材图片,AI国漫女神系列
本次分享的是凡人修仙传动画人物范静梅的AI图片素材,图片都是SD生成的,都是高清大图,非凡人修仙传动画视频截图。部分范静梅图片如下: 图片及模型文件下载链接: https://pan.xunlei.com/s/VOXgauAl7VsuksE...

凡人修仙传动画银月高清壁纸素材图片,AI国漫女神系列
本次分享的是凡人修仙传动画人物银月AI图片素材,图片都是SD生成的,都是高清大图,非凡人修仙传动画视频截图。这次生成的不多,部分图片如下: 图片及模型文件下载链接: https://pan.quark.cn/s/1bd714c2d5e7 h...

图片元数据信息删除工具,支持windows/mac/Linux
有些图片可能会附带很多的信息,如果你想把图片的元数据信息删除的话,可以使用exifcleaner,这是一款用于清理图像元数据的跨平台桌面 GUI 应用程序,软件支持支持 Linux、macOS 10.10+ 和 Windows 7+(仅限 ...

凡人修仙传动画慕沛灵高清壁纸图片,单人AI图片素材
最近需要用到凡人修仙传动画里人物图片,直接在视频里截图的话要么身体姿势不对要么就身体不完整等,截不到想要的图,然后就炼了一批AI图,这次分享的这些都是慕沛灵的单人图片,全身照,都是高清的,由于只需要竖屏,所以我没生成横屏图片。喜欢的可以拿去...

免费在线视频去水印工具方法
本次分享一个免费的在线视频去水印工具–记灵 这个在线工具目前是完全免费的,上传mp4视频文件,然后鼠标框选去水印区域,然后点击处理等待处理完成就可以了,操作非常简单。 这个去水印工具是采用打码的方式覆盖原水印区域的,并不是AI智...

即梦AI(可灵)视频制作9种电影级运镜提示词,小白秒变大导演
视频制作方式多种多样,想做出一个观感体验极佳的精彩视频,运镜效果少不了。这里整理了9种实用的电影级运镜方式,学会这些运镜小白也可以成为大导演。你可以将这些运镜效果用在即梦或可灵AI中视频生成的时候,提供了运镜参考关键词,如果不会写关键词的,...