这次分享的是本人二次开发优化后的V3版本语音识别转文字软件,V3版本更新内容如下:
音视频文件识别版:
1、优化字幕生成算法,生成的字幕时间戳更准确,
2、新增批量识别功能,可将选定的文件夹内的音频视频文件依次进行识别,
3、新增热词定制功能,医疗、法律或其它技术领域中很多陌生冷门词,热词定制功能可自行设置热词,更好的提高了语音识别的准确率
4、默认导出类型为txt文本和srt字幕格式
实时语音识别版:
新增支持实时识别电脑内播放声音,也可同时识别电脑内声音和麦克风声音
本软件识别中文效果优于OpenAI的whisper,但多语言识别功能不足。
如果环境比较嘈杂,有很多无效音频片段,可通过提高音量阈值的值,来过滤掉低音噪音部分
如果需要对识别内容进行翻译,国内用户可使用百度翻译,百度翻译API申请教程请看《最新百度翻译api免费申请AppId和AppSecret流程,每月免费100万字符》
如果需要识别电脑内播放的声音,需要先进行电脑设置,鼠标右键点击电脑屏幕右下角音量喇叭图标,选择 【声音】,点击录制选项卡,鼠标右键点击【立体声混音】,选择【设置为默认设备】,如果立体声混音没启动的话,需要先启用,然后运行软件开始处理,就可以实时识别电脑播放声音了。
如果想同时接收麦克风声音和电脑内播放声音,可在软件音频源中选择电脑播放声音,电脑声音设置里-录制-麦克风,点击鼠标右键,选择麦克风属性,勾选【侦听此设备】
注意事项:
本软件只支持识别中英文,不支持识别其它语言
如果批量识别音视频文件,可选择音视频所在文件夹,软件会依次处理文件夹内的音视频文件,注意输入框中文件夹路径地址末尾不能有斜杠”\”,D:\test\ 会报错,正确路径地址应该类似如下形式:D:\test
软件运行路径中不要出现中文及空格,否则会报错
软件只支持处理wav、mp3、mp4格式文件
语音识别转文字软件V3版本下载链接:
有任何问题可在爱发电与我实时交流
语音识别转文字软件V1版本下载链接: