clone-voice是一个声音克隆工具,可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。使用非常简单,没有英伟达显卡GPU也可以使用,下载整合包解压后双击 app.exe 打开一个web界面,鼠标点点就能用。支持 中、英、日、韩、法、德、意等16种语言,可在线从麦克风录制声音。为更好的效果建议录制时长5秒到20秒,发音清晰准确,不要存在背景噪声。
本软件为免费开源软件,原项目地址:https://github.com/jianchang512/clone-voice,应用操作界面如图所示:
- clone-voice声音转换操作步骤
- 选择【文字->声音】按钮,在文本框中输入文字、或点击导入srt字幕文件,选择要使用的声音,或是自己录制声音,然后点击“立即开始”。
- 选择【声音->声音】按钮,点击或拖拽要转换的音频文件(mp3/wav/flac),然后从“要使用的声音文件”下拉框中选择要克隆的音色,如果没有满意的,也可以点击“本地上传”按钮,选择已录制好的5-20s的wav/mp3/flac声音文件。或者点击“开始录制”按钮,在线录制你自己的声音5-20s,录制完成点击使用。然后点击“立即开始”按钮
- 如果机器拥有N卡GPU,并正确配置了CUDA环境,将自动使用CUDA加速
如果无法使用,提示连接 github 网站失败,到网盘里把 extra-to-tts_cache.zip 解压后得到2个文件,将这2个文件复制到 tts_cache 目录下
如果点击按钮【从本地上传】,上传了自己想用的声音,但是声音列表里没有,关闭软件重新启动就可以在列表里看到了
TTS文字转语音声音克隆软件clone-voice整合包下载:
百度网盘:
https://pan.baidu.com/s/1uaoLBN4scGwYJbVRNpzlJA?pwd=tqis 提取码: tqis
夸克网盘:
https://pan.quark.cn/s/95c84ff065d3