AI软件下载
有趣网站推荐及实用软件下载

FunASR语音识别转文字软件区分说话人版

FunASR是一款优秀的基础语音识别框架,配合阿里通义团队开发的其它语音识别模型,能够实现非常好语音转文字效果,尤其在中文语音识别方面,鉴于有些用户需要对语音识别内容区分说话人,我重新做了一版区分说话人的版本。软件支持多语言识别,但是还是尽量用于中文语音识别。

FunASR语音识别转文字软件区分说话人版

整合包使用说明

首先将网盘内的软件压缩包下载到本地电脑并解压,然后双击启动软件.bat,等待软件启动后自动打开webui界面。

软件整体操作比较简单,导入音频或mp4视频文件,点击处理按钮即可。

如果用于特殊行业,识别效果不准确的话,可以设置热词提升识别准确率。

识别结果保存在outputs文件夹内。

注意事项

使用前先更新英伟达显卡驱动

软件运行路径中不要出现中文及空格,否则会报错

软件只支持处理wav、mp3、mp4、mkv格式文件

本地整合包只支持Windows 10或11系统

如果音频中有音乐、音效或其它无法识别的特殊声音,可能会导致识别失败报错终止,如果报错的话就看是哪个文件引发错误的,可跳过该文件,或是用faster-whisper处理这个文件

软件下载链接

此内容仅限VIP查看,请先
可通过每日签到获得积分兑换VIP

AI软件用不了?2元爽玩4090: 立即体验>>

热门大语言模型API免费体验: 立即获取>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(0) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

LTX2.3+comfyui音频驱动视频生成工作流

这是一个基于 ComfyUI 的 LTX 2.3 音视频同步生成工作流,核心功能是上传一段音频 + 参考图片(可多张图),自动生成与音频内容对应的视频,适合制作人物说话、唱歌等口型同步视频。工作流使用8位量化版ltx2.3模型,显存需求降低...

windows电脑C盘垃圾查找清理软件

电脑用了好几年了,尽管我安装软件从来不主动装到C盘,偶尔也会清理垃圾,但是用的久了,容量也是在慢慢减少。我C盘303G,现在就剩了24G了,已经会影响到系统性能和虚拟内存调度了,已经不能不管了。C盘不装软件的话大多都是缓存,文件太多了,有时...

Mineru PDF转markdown软件局域网版

对于有的电脑配置比较低或是win7系统等电脑无法使用Mineru情况,可以使用局域网内可运行软件的电脑运行Mineru,然后其它电脑或手机等终端输入IP地址,打开运行软件的IP地址来使用Mineru。 具体用法: 下载局域网版压缩包到本地电...

Studio One Pro 7免费开心版下载-诺瓦小站

Studio One Pro 7免费开心版下载

Studio One 7是一款专业数字音频工作站(DAW)软件,它是音乐制作、混音、母带处理与现场演出一体化的旗舰软件。 ✨ 核心功能 1. AI 智能音轨分离(Stem Separation) AI 驱动的音轨分离功能允许用户将混缩后的音...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫