最好用的免费中文音频视频语音识别转文字软件FunASR V3版，批量音视频录音转文字提取工具下载-诺瓦小站

本次分享的是基于FunASR制作的中英文音频视频语音识别转文字软件，本人二次开发优化后的V3版本语音识别转文字软件windows电脑版

文章目录 隐藏

整合包更新说明：

V3版本更新内容如下：

音视频文件识别版：

1、优化字幕生成算法，生成的字幕时间戳更准确，

2、新增批量识别功能，可将选定的文件夹内的音频视频文件依次进行识别，

3、新增热词定制功能，医疗、法律或其它技术领域中很多陌生冷门词，热词定制功能可自行设置热词，更好的提高了语音识别的准确率

4、默认导出类型为txt文本和srt字幕格式

2025-09-11版本更新内容

删除谷歌翻译，新增支持在线大语言模型翻译功能

代码优化，处理时间缩短至原来的四分之一

重做UI操作界面

FunASR语音识别转文字软件介绍

本软件识别中文效果优于OpenAI的whisper，但多语言识别能力不足。

本软件基于FunASR模块及paraformer-zh模型开发制作

FunASR 是一款基础语音识别工具包，提供多种功能，包括语音识别 (ASR)、语音活动检测 (VAD)、标点符号恢复、语言模型、说话人验证、说话人分类和多说话人自动语音识别 (ASR)。

paraformer-zh模型：训练数据60000小时普通话，参数2.2亿

整合包用法：

将网盘内的软件压缩包下载到本地电脑上并解压，双击运行启动软件.bat。

第一次运行会慢些，需要耐心等待，只要没有输出报错，就一直等着，具体时间由个人电脑配置决定。

软件启动成功后会自动打开webui界面。点击按钮上传待处理文件，或是将音视频文件鼠标左键按住拖入左侧的文件输入框内，然后点击【开始处理】按钮，即可开始识别转换音视频文件。

如果需要将识别结果翻译成其它语言的话，可以选择翻译功能，支持百度翻译和在线大语言模型翻译。

如果选择百度翻译，先申请百度翻译API，申请教程请看《最新百度翻译api免费申请AppId和AppSecret流程，每月免费100万字符》

如果选择在线大语言模型翻译，类OPENAI的api都可以使用。模型名，BASE URL，API KEY根据实际使用情况填写即可，如果你还没有API的话，可以点击下方链接申请免费deepseek api。

点击申请Deepseek API>>

还没有账号就直接注册一个就可以，新用户赠送50万tokens和10元赠金，算下来有不少tokens可用

各输入框按实际情况填写即可，如

模型名：deepseek-ai/DeepSeek-V3-0324

Base URL：https://api.modelverse.cn/v1

API KEY：你的api key

如果想使用本地大语言模型ollama的话，可以按以下方式填写。

模型名：如，gemma3:4b

Base URL：http://127.0.0.1:11434/v1

API KEY：随便填，如，a

热词就是辅助软件识别音频内容的，比如伊卡，音频里出现这个词，但是是生僻词，软件不懂。你可以把这个词填入hot_words.txt内，软件再次遇到这个发音的时候就会识别成伊卡这个词，非常适合某些领域专有名词识别。热词每行一个，在线使用的话，可以把热词直接填入输入框内，每行一个词。

视频教程和效果演示：https://nuowa.net/1729

注意事项：

本软件只支持识别中英文，不支持识别其它语言

软件运行路径中不要出现中文及空格，否则会报错

软件只支持处理wav、mp3、mp4、mkv格式文件

本地整合包只支持Windows 10或11系统

软件对英伟达显卡要求不高，运行时显存消耗1G，使用前先更新英伟达显卡驱动

如果音频中有音乐、音效或其它无法识别的特殊声音，可能会导致识别失败报错终止，如果报错的话就看是哪个文件引发错误的，可跳过该文件，或是用faster-whisper处理这个文件

语音识别转文字软件下载链接：

https://pan.quark.cn/s/8327dfd8a5b1

在线一键启动

如果你没有windows电脑，或是没有英伟达显卡，或是英伟达显卡配置太低用不了，可以使用我制作的在线一键启动云镜像，无需配置环境，对本地电脑没有任何要求。

点击使用云镜像>>

最好用的免费中文音频视频语音识别转文字软件FunASR V3版，批量音视频录音转文字提取工具下载

整合包更新说明：

FunASR语音识别转文字软件介绍

注意事项：

语音识别转文字软件下载链接：

在线一键启动

同类软件推荐

相关推荐

最近更新

Claude 再放大招，Sonnet 5 来了

AutoVidDub支持分角色配音的全自动视频翻译配音加字幕工具

极速轻便声音克隆语音合成软件MOSS-TTS-Nano整合包，CPU可流畅运行

最强分说话人语音识别工具，支持批量音视频识别转字幕，字幕翻译内容总结

最强PR中文视频自动语音识别生成字幕插件，语音识别准确率高支持多国语言

祝贺凡人修仙传2026年新年番开播同时在线人数超64万

Premiere Pro静音片段自动剪辑插件——Silence Remover使用教程及下载

蛙蛙写作-能替你"打工"的AI写作平台，附邀请码：UZekHC

PDFMathTranslate + MinerU 批量PDF全文双语翻译转Markdown工具

Claude居然自称“本人”

热门文章

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏，我将有更多的动力继续提供优质内容，让我们一起创建更加美好的世界！

支付宝扫一扫

微信扫一扫