AI软件下载
有趣网站推荐及实用软件下载

实时语音识别转文字软件V3版,批量音频视频录音转文字提取工具下载

这次分享的是本人二次开发优化后的V3版本语音识别转文字软件,V3版本更新内容如下:

音视频文件识别版:

1、优化字幕生成算法,生成的字幕时间戳更准确,

2、新增批量识别功能,可将选定的文件夹内的音频视频文件依次进行识别,

3、新增热词定制功能,医疗、法律或其它技术领域中很多陌生冷门词,热词定制功能可自行设置热词,更好的提高了语音识别的准确率

4、默认导出类型为txt文本和srt字幕格式

实时语音识别版:

新增支持实时识别电脑内播放声音,也可同时识别电脑内声音和麦克风声音

本软件识别中文效果优于OpenAI的whisper,但多语言识别功能不足。

如果环境比较嘈杂,有很多无效音频片段,可通过提高音量阈值的值,来过滤掉低音噪音部分

如果需要对识别内容进行翻译,国内用户可使用百度翻译,百度翻译API申请教程请看《最新百度翻译api免费申请AppId和AppSecret流程,每月免费100万字符

如果需要识别电脑内播放的声音,需要先进行电脑设置,鼠标右键点击电脑屏幕右下角音量喇叭图标,选择 【声音】,点击录制选项卡,鼠标右键点击【立体声混音】,选择【设置为默认设备】,如果立体声混音没启动的话,需要先启用,然后运行软件开始处理,就可以实时识别电脑播放声音了。

如果想同时接收麦克风声音和电脑内播放声音,可在软件音频源中选择电脑播放声音,电脑声音设置里-录制-麦克风,点击鼠标右键,选择麦克风属性,勾选【侦听此设备】

视频教程和效果演示:https://nuowa.net/1729

注意事项:

本软件只支持识别中英文,不支持识别其它语言

如果批量识别音视频文件,可选择音视频所在文件夹,软件会依次处理文件夹内的音视频文件,注意输入框中文件夹路径地址末尾不能有斜杠”\”,D:\test\ 会报错,正确路径地址应该类似如下形式:D:\test

软件运行路径中不要出现中文及空格,否则会报错

软件只支持处理wav、mp3、mp4格式文件

整合包只支持Windows 10或11系统

有Win11用户发现软件无法检测到音频,也就是电脑立体声混音没有音频输入,可以安装voicemeeter虚拟声卡解决。在【1 HARDWARE INPUT】设置硬件声音输入设备,在【VIRTUAL INPUT】选中【B】,在【HARDWARE OUT】选择声音输出设备,然后打开电脑系统-声音-录制,将默认设备选择为VoiceMeeter VAIO3 Output,VoiceMeeter点击下载>>

语音识别转文字软件V3版本下载链接:

https://pan.quark.cn/s/d8bd6f59fc72

电脑不给力运行不了?试试高配云电脑>>

1对1人工答疑支持: https://nuowa.net/1806
赞(6) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

临时邮箱,一次性匿名gmail.com邮箱

有时候网站需要测试一些功能,比如注册登录等,需要用到邮箱,但是自己的邮箱有限,不能更多的测试效果,这时候就需要一些不同后缀的一次性邮箱,网上有很多这样的一次性匿名邮箱,后缀很多,非常适合测试使用,下面分享几个比较好用的临时邮箱。 Gmail...

检测和删除高相似度图片软件AntiDupl免费下载-诺瓦小站

检测和删除高相似度图片软件AntiDupl免费下载

前几天整理手机图片,手机中拍了大量的图片,很多图片是连拍的,图片的相似度极高,甚至就是一模一样的图片,有时候看相册的时候会删除掉这些图片,有时候忘了删。在电脑上整理备份的时候这些高相似度的图片比较占空间,也会额外增加处理时间,所以想找个图片...

项目实操变现思路分享之AI绘画-诺瓦小站

项目实操变现思路分享之AI绘画

本次和大家分享的实操项目变现思路是AI绘画相关的,虽然AI绘画已经火了很久了,但是仍有很多玩法,有了其它一些AI工具的加持,操作起来也更容易,项目具体内容请看PDF文档。 教程链接: https://afdian.com/p/982e793...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫