CosyVoice情感语音合成软件一键启动整合包,带音色模型训练工具
CosyVoice是目前比较火的TTS文字转语音工具,具有合成情感语音的能力,语音合成效果非常好。不光可以文字转语音,还可以实现快速声音克隆,3秒声音素材即可克隆音色,而且对电脑配置要求不是很高,一般电脑都能带动。是一款比较不错的免费的语音...
CosyVoice是目前比较火的TTS文字转语音工具,具有合成情感语音的能力,语音合成效果非常好。不光可以文字转语音,还可以实现快速声音克隆,3秒声音素材即可克隆音色,而且对电脑配置要求不是很高,一般电脑都能带动。是一款比较不错的免费的语音...
本次和大家分享一个非常强大的大语言模型提供实用化交互接口的应用gpt_academic,该应用有如下一些功能如:PDF论文阅读/润色/写作,总结绘制脑图,查找语法错误,学术英中互译,联网搜索问题答案,Python和C++等项目剖析&...
gpt_academic支持API方式调用各种在线大语言模型如ChatGPT等,但是有些人可能没有在线大模型的API,或是想使用本地电脑部署的大语言模型,gpt_academic是支持调用本地电脑上安装的大语言模型的,本次以阿里通义千问大语...
本次和大家分享一个本地电脑免费搭建ChatGPT聊天工具的应用ChatGPT-Next-Web,这个应用还支持Google Gemini,anthropic claude,Baidu,ByteDance,Alibaba,iflytek,Ch...
本次和大家分享一个音频驱动口型数字人视频制作工具VideoReTalking,这个软件可以根据一段音频对视频中的人物重新生成口型,可以实现音频口型同步,重新生成一段自然流畅的人物说话视频,本应用为免费开源应用。 VideoReTalking...
ChatPaper是一个免费的PDF论文全文总结及全文翻译软件,软件可以总结本地单个PDF文档或整个文件夹内的所有PDF文档,也可以从arxiv网站上搜索指定论文进行总结,加快获取知识理解知识的速度。作者开发意图:希望让语言不再成为中国人获...
flux是目前非常火的,也是非常强大的一款文本到图像生成模型,该项目由黑森林实验室(Black Forest Labs)开发,经过之前的多代版本模型开发迭代,flux生成的图片可以说质量非常的高,支持生成各种尺寸图片,最大图片可达8192&...
EchoMimic是一个可以让照片开口说话的应用,说话内容为你提供的音频,之前网络上出现比较多的复活逝去亲人,或是制作一些娱乐视频,都可以使用本应用实现,本应用为免费开源应用, EchoMimic配置参数说明: 宽度和高度:决定了最终生成的...
今天和大家分享一个本人制作的电脑语音打字软件,软件通过接收你说话的声音,识别出文字,然后输入到word文档中,相当于一个说话打字输入法,直接说话就能打字,当然也支持手动打字输入内容。软件操作界面如下: 软件只支持docx格式的word文档 ...
扩图应用diffusers-image-outpaint是一种基于扩散模型的图像生成方法。它能根据原图像内容,继续生成图像的外部区域,增加图片尺寸,增加图片内容,新生成的图片非常自然完整。在某些使用场景需要修改图片尺寸或是图片内容时,可使用...