AI软件下载
有趣网站推荐及实用软件下载

多人对话语音合成软件CSM整合包,AI多人文字转语音工具

CSM是发布不久的一款多人对话语音生成模型,声音自然延迟低,同时支持克隆音色语音合成,我基于当前最新版本制作了免安装一键启动整合包。

多人对话语音合成软件CSM整合包,AI多人文字转语音工具

Sesame CSM介绍

CSM(Conversational Speech Model) 是由硅谷团队 Sesame AI Labs 开发的开源语音对话模型,主打高自然度、低延迟的语音交互。其核心目标是解决传统语音合成的“恐怖谷效应”(即语音接近真人但细微不自然引发不适感),通过情感表达和上下文感知生成接近人类对话的语音。

CSM整合包使用教程

首先将网盘内的软件压缩包下载到本地电脑上并解压,双击启动软件.exe启动。

第一次启动会慢些,软件成功启动后会自动打开webui界面。

在Speaker A和Speaker B下拉列表中选择说话发音人。

或是点击【Or add your own voice prompt】展开,上传你自己的音频样本和【Speaker prompt】音频样本文本内容。软件将克隆你上传的音频音色用于语音合成。

【Conversation content】输入对话内容。

每人说一行,轮流交替往下说,第一行文本从Speaker A开始合成

点击下方的【Generate conversation】即可开始生成对话语音。

视频教程及效果演示:https://nuowa.net/1956

注意事项

英伟达显卡显存不低于6G

目前语音合成语言主要为英语

软件运行路径中不要出现非英文字符及空格,待使用文件也要注意

软件只支持win10或win11,不支持其他版本Windows系统,也不支持手机和MAC

多人对话语音合成CSM一键启动整合包下载链接

https://pan.quark.cn/s/42c80105d8ee

https://pan.baidu.com/s/1w1P440l9hRV1j0Fy9dctyQ?pwd=btvd

CSM本地电脑安装部署教程

https://nuowa.net/1955


AI软件用不了?2元爽玩4090: 立即体验>>

热门大语言模型API免费体验: 立即获取>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(1) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

LTX2.3+comfyui音频驱动视频生成工作流

这是一个基于 ComfyUI 的 LTX 2.3 音视频同步生成工作流,核心功能是上传一段音频 + 参考图片(可多张图),自动生成与音频内容对应的视频,适合制作人物说话、唱歌等口型同步视频。工作流使用8位量化版ltx2.3模型,显存需求降低...

windows电脑C盘垃圾查找清理软件

电脑用了好几年了,尽管我安装软件从来不主动装到C盘,偶尔也会清理垃圾,但是用的久了,容量也是在慢慢减少。我C盘303G,现在就剩了24G了,已经会影响到系统性能和虚拟内存调度了,已经不能不管了。C盘不装软件的话大多都是缓存,文件太多了,有时...

Mineru PDF转markdown软件局域网版

对于有的电脑配置比较低或是win7系统等电脑无法使用Mineru情况,可以使用局域网内可运行软件的电脑运行Mineru,然后其它电脑或手机等终端输入IP地址,打开运行软件的IP地址来使用Mineru。 具体用法: 下载局域网版压缩包到本地电...

Studio One Pro 7免费开心版下载-诺瓦小站

Studio One Pro 7免费开心版下载

Studio One 7是一款专业数字音频工作站(DAW)软件,它是音乐制作、混音、母带处理与现场演出一体化的旗舰软件。 ✨ 核心功能 1. AI 智能音轨分离(Stem Separation) AI 驱动的音轨分离功能允许用户将混缩后的音...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫