AI软件下载
有趣网站推荐及实用软件下载

实时语音识别转文字软件V3版,批量音频视频录音转文字提取工具下载

这次分享的是本人二次开发优化后的V3版本语音识别转文字软件,V3版本更新内容如下:

音视频文件识别版:

1、优化字幕生成算法,生成的字幕时间戳更准确,

2、新增批量识别功能,可将选定的文件夹内的音频视频文件依次进行识别,

3、新增热词定制功能,医疗、法律或其它技术领域中很多陌生冷门词,热词定制功能可自行设置热词,更好的提高了语音识别的准确率

4、默认导出类型为txt文本和srt字幕格式

实时语音识别版:

新增支持实时识别电脑内播放声音,也可同时识别电脑内声音和麦克风声音

本软件识别中文效果优于OpenAI的whisper,但多语言识别功能不足。

如果环境比较嘈杂,有很多无效音频片段,可通过提高音量阈值的值,来过滤掉低音噪音部分

如果需要对识别内容进行翻译,国内用户可使用百度翻译,百度翻译API申请教程请看《最新百度翻译api免费申请AppId和AppSecret流程,每月免费100万字符

如果需要识别电脑内播放的声音,需要先进行电脑设置,鼠标右键点击电脑屏幕右下角音量喇叭图标,选择 【声音】,点击录制选项卡,鼠标右键点击【立体声混音】,选择【设置为默认设备】,如果立体声混音没启动的话,需要先启用,然后运行软件开始处理,就可以实时识别电脑播放声音了。

如果想同时接收麦克风声音和电脑内播放声音,可在软件音频源中选择电脑播放声音,电脑声音设置里-录制-麦克风,点击鼠标右键,选择麦克风属性,勾选【侦听此设备】

视频教程和效果演示:https://nuowa.net/1729

注意事项:

本软件只支持识别中英文,不支持识别其它语言

如果批量识别音视频文件,可选择音视频所在文件夹,软件会依次处理文件夹内的音视频文件,注意输入框中文件夹路径地址末尾不能有斜杠”\”,D:\test\ 会报错,正确路径地址应该类似如下形式:D:\test

软件运行路径中不要出现中文及空格,否则会报错

软件只支持处理wav、mp3、mp4格式文件

整合包只支持Windows 10或11系统

有Win11用户发现软件无法检测到音频,也就是电脑立体声混音没有音频输入,可以安装voicemeeter虚拟声卡解决。在【1 HARDWARE INPUT】设置硬件声音输入设备,在【VIRTUAL INPUT】选中【B】,在【HARDWARE OUT】选择声音输出设备,然后打开电脑系统-声音-录制,将默认设备选择为VoiceMeeter VAIO3 Output,VoiceMeeter点击下载>>

语音识别转文字软件V3版本下载链接:

https://pan.quark.cn/s/d8bd6f59fc72

AI应用在线一键启动,低价爽玩4090:立即体验>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(9) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

comfyui视频人物换主体工作流及模型下载-诺瓦小站

comfyui视频人物换主体工作流及模型下载

本次分享一个好玩的视频人物换主体工作流,本工作流可以使用一张图片中的主体替换视频中的人物主体。比如抖音上很多热门的猴子炒饭,奥特曼炒饭,猴子vlog等等,都可以使用人物主体替换把原来视频中的人物替换成指定的人物。 comfyui工作流节点使...

凡人修仙传动画韩立高清图片壁纸素材AI绘画图集-诺瓦小站

凡人修仙传动画韩立高清图片壁纸素材AI绘画图集

恭迎韩天尊! 祝贺韩天尊顺利结婴! 热门国漫凡人修仙传动画已经更新了5年了,最新一集,主人公韩立顺利结婴,成为一名元婴修士。我属于是比较喜欢看动漫的,看过的动漫估计没过百也得大几十了,热门国漫大多都看过。凡人修仙传算是最喜欢的动漫之一,韩立...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫