AI软件下载
有趣网站推荐及实用软件下载

文字转语音神器工具CosyVoice 3.0整合包下载,声音克隆情感语音合成软件

热门文字转语音应用CosyVoice发布2.0了,CosyVoice是一个非常强大的语音合成工具,提供文字转语音、声音克隆和情感语音合成控制功能。这是一个由阿里团队推出的应用,在免费声音克隆和语音合成软件中,算是比较不错的一款应用了。合成的语音非常的自然,不会像以前其它软件那么的僵硬。从1.0版本我就分享过了,可以查看我以前分享的文章《CosyVoice情感语音合成软件一键启动整合包,带音色模型训练工具》。我把这个2.0版本也做了一个一键启动整合包,并制作了一个适用2.0版本的UI界面。


2026-02-01 更新CosyVoice 3.0

CosyVoice 3.0说明

Fun-CosyVoice 3.0 是一个基于大型语言模型 (LLM) 的高级文本转语音 (TTS) 系统,在内容一致性、说话人相似度和韵律自然性方面超越了其前身 (CosyVoice 2.0)。它旨在实现零样本多语种野外语音合成。

主要特点

  • 语言覆盖范围: 涵盖9种常用语言(中文、英语、日语、韩语、德语、西班牙语、法语、意大利语、俄语),18种以上的中文方言/口音(广东话、闽南话、四川话、东北话、陕西话、山西话、上海话、天津话、山东话、宁夏话、甘肃话等),同时支持多语种/跨语种零样本语音克隆。
  • 内容一致性和自然性: 在内容一致性、说话人相似度和韵律自然性方面达到最先进的性能。
  • 发音修复: 支持中文拼音和英文CMU音素的发音修复,提供更多可控性,因此适用于生产使用。
  • 文本规范化: 支持读取数字、特殊符号和各种文本格式,无需传统的前端模块。
  • 双向流处理: 支持文本输入流和音频输出流,并在保持高质量音频输出的同时实现低至150毫秒的延迟。
  • 指令支持: 支持多种指令,如语言、方言、情感、速度、音量等。
CosyVoice 2.0说明

CosyVoice 2.0相比1.0版本,新版本语音生成更准确、更稳定、更快速、功能更强大。

多种语言
支持语言:中文、英文、日语、韩语、中国方言(粤语、四川话、上海话、天津话、武汉话等)
跨语言和混合语言:支持跨语言和代码切换场景的零样本语音克隆。
超低延迟
双向流支持:CosyVoice 2.0 集成了离线和流建模技术。
快速首包合成:实现低至 150 毫秒的延迟,同时保持高质量的音频输出。
高精度
改进发音:与 CosyVoice 1.0 相比,发音错误减少了 30% 到 50%。
基准测试成果:在Seed-TTS评估集的硬测试集上取得最低的字符错误率。
稳定性强
音色一致性:确保零样本和跨语言语音合成的可靠语音一致性。
跨语言合成:与 1.0 版本相比有显著的改进。
自然体验
增强韵律和音质:改进了合成音频的对齐,将 MOS 评估分数从 5.4 提高到 5.53。
情感和方言灵活性:现在支持更细致的情感控制和口音调整。

CosyVoice整合包使用说明

首先到网盘内将压缩包下载到电脑上解压,然后双击运行【启动软件.bat】,稍等一会即可启动webUI界面。软件主要有下面4项功能:

0样本复刻

只需提供一段3秒的音频素材,即可克隆音色,并使用这个音色进行文字转语音操作。声音音色克隆效果非常好,非常逼真。

支持跨语种复刻。


指令控制

通过自然语言指令控制生成语音的风格、语种或语速。如生成各地方言,各种情绪等。


高级控制

直接构建完整的 Prompt 字符串。适用于:

  1. 插入 [breath][laught][noise] 等标签。
  2. 拼音修正 (Hotfix),如 [j][ǐ]
  3. 日语合成(需输入片假名)。

所有功能都要依赖于音频样本,所以你首先需要先导入一个3-5秒的prompt音频文件和prompt文本。设置完成后可以点击下方生成音频按钮来合成语音,语音生成完成后可点击预览播放音频,也可以点击音频右侧的下载符号按钮下载音频结果。

注意事项

软件运行路径中不要有非英文字符及空格

未测试最低电脑配置要求,建议英伟达显卡显存4G以上用户使用

整合包只支持Windows 10或11系统

日语文本必须手动转换为片假名输入。

声音克隆及语音合成工具CosyVoice 3.0一键启动包下载地址

此内容仅限VIP查看,请先
可通过每日签到获得积分兑换VIP


AI软件用不了?2元爽玩4090: 立即体验>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(11) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

Nova数字人虚拟主播软件下载-诺瓦小站

Nova数字人虚拟主播软件下载

这个还是2023年做的数字人项目,发现仍有人有这方面需求,我又重新做了一下。把其它所有功能都删除了,只保留了个音频文件驱动口型讲话的功能。 软件功能及用法 启动软件,点击右上角扳手按钮,打开设置界面,先选中一个主播人物,再选择导入一段音频文...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫