这次分享的是本人二次开发优化后的V3版本语音识别转文字软件,V3版本更新内容如下:
音视频文件识别版:
1、优化字幕生成算法,生成的字幕时间戳更准确,
2、新增批量识别功能,可将选定的文件夹内的音频视频文件依次进行识别,
3、新增热词定制功能,医疗、法律或其它技术领域中很多陌生冷门词,热词定制功能可自行设置热词,更好的提高了语音识别的准确率
4、默认导出类型为txt文本和srt字幕格式
实时语音识别版:
新增支持实时识别电脑内播放声音,也可同时识别电脑内声音和麦克风声音
本软件识别中文效果优于OpenAI的whisper,但多语言识别功能不足。

如果环境比较嘈杂,有很多无效音频片段,可通过提高音量阈值的值,来过滤掉低音噪音部分
如果需要对识别内容进行翻译,国内用户可使用百度翻译,百度翻译API申请教程请看《最新百度翻译api免费申请AppId和AppSecret流程,每月免费100万字符》
如果需要识别电脑内播放的声音,需要先进行电脑设置,鼠标右键点击电脑屏幕右下角音量喇叭图标,选择 【声音】,点击录制选项卡,鼠标右键点击【立体声混音】,选择【设置为默认设备】,如果立体声混音没启动的话,需要先启用,然后运行软件开始处理,就可以实时识别电脑播放声音了。
如果想同时接收麦克风声音和电脑内播放声音,可在软件音频源中选择电脑播放声音,电脑声音设置里-录制-麦克风,点击鼠标右键,选择麦克风属性,勾选【侦听此设备】

视频教程和效果演示:https://nuowa.net/1729
注意事项:
本软件只支持识别中英文,不支持识别其它语言
如果批量识别音视频文件,可选择音视频所在文件夹,软件会依次处理文件夹内的音视频文件,注意输入框中文件夹路径地址末尾不能有斜杠”\”,D:\test\ 会报错,正确路径地址应该类似如下形式:D:\test
软件运行路径中不要出现中文及空格,否则会报错
软件只支持处理wav、mp3、mp4格式文件
整合包只支持Windows 10或11系统
有Win11用户发现软件无法检测到音频,也就是电脑立体声混音没有音频输入,可以安装voicemeeter虚拟声卡解决。在【1 HARDWARE INPUT】设置硬件声音输入设备,在【VIRTUAL INPUT】选中【B】,在【HARDWARE OUT】选择声音输出设备,然后打开电脑系统-声音-录制,将默认设备选择为VoiceMeeter VAIO3 Output,VoiceMeeter点击下载>>

语音识别转文字软件V3版本下载链接:
https://pan.quark.cn/s/d8bd6f59fc72
相关推荐
麦克风电脑内声音实时识别转文字软件FunASR整合包V4下载
音频视频转文字软件faster-whisper 1.1.1整合包下载,精准快速语音转录工具
免费语音识别转文字软件SenseVoice整合包,实时语音转文字翻译软件
免费语音识别转文字软件faster-whisper整合包下载,音频视频文字提取工具
高质量高性能文本转语音系统index-tts整合包下载,高效声音克隆软件
抖音超强AI数字人视频制作软件LatentSync整合包,音频驱动口型讲话
最强AI换衣脱衣软件MagicQuill下载,AI一键智能修改图片内容
实时直播换脸软件deep-live-cam v1.7 2024-12-10最新版,视频换脸工具
最近更新

AI描述万物软件describe-anything整合包,精准描述图片视频中指定区域内容
本次和大家分享一个英伟达联合其他大学开发的一款应用describe-anything,该应用可以通过AI识别分析并详细描述图片视频中指定区域物体内容,我基于最新版制作了免安装一键启动整合包。 describe-anything介绍 Desc...

高效可控歌曲生成器ACE-Step一键启动整合包,音乐人的歌曲创作利器
又一款AI歌曲创作利器:ACE-Step,ACE-Step是刚发布不久的AI自动谱曲AI自动演唱软件,软件在歌曲生成速度、音乐连贯性和可控性上相对同类软件有了较大提升。ACE-Step在3小时前刚发布了新版本,我基于当前最新版本制作了免安装...

超逼真对话型文字转语音软件Dia-1.6B免安装一键启动整合包下载
本次分享一个刚出的超逼真对话型文字转语音软件Dia-1.6B,这个TTS软件不像传统的文字转语音那样,Dia可以生成对话音频,还可以生成非语言音效,如笑声,咳嗽,清嗓子等,还支持声音克隆。我基于当前Dia最新版本制作了免安装一键启动整合包。...

高精度2D图片转3D网格模型软件Stable3DGen整合包下载
本次和大家分享另一个非常牛叉的图片转3D模型软件Stable3DGen,从官方演示对比来看,效果要好于我之前分享的腾讯混元3D和TRELLIS,精度更高更细腻。基于当前最新版本我制作了一键启动整合包。 Stable3DGen介绍 随着从二维...

2D照片转3D视频软件stable-virtual-camera免安装一键启动整合包下载
本次和大家分享一个好玩实用的2D图片转3D视频软件stable-virtual-camera,支持多种相机模式,生成的3D视频效果丰富多样,适合多种使用场景,我基于当前最新版本制作了免安装一键启动整合包。 stable-virtual-ca...

AI歌曲创作软件DiffRhythm一键启动包,自定义风格AI谱曲演唱
DiffRhythm是首个基于扩散技术的开源音乐生成模型,能够创作完整的歌曲,包括AI谱曲,AI演唱。基于当前最新V1.2版本我制作了免安装一键启动整合包。 DiffRhythm介绍 Di♪♪Rhythm:速度惊人、简单至极、具有潜在扩散的...

虚拟试衣产品设计多图合成软件UNO一键启动整合包,人物转动漫工具
UNO是字节跳动开发的一款多主体图像生成软件,解决了角色或物体一致性的问题,可用于漫画、虚拟试衣等场景。我基于当前最新版本制作了免安装一键启动整合包。 UNO介绍 UNO是一款基于扩散模型的AI图像生成工具,核心目标是解决AI生成图像时难以...

临时邮箱,一次性匿名gmail.com邮箱
有时候网站需要测试一些功能,比如注册登录等,需要用到邮箱,但是自己的邮箱有限,不能更多的测试效果,这时候就需要一些不同后缀的一次性邮箱,网上有很多这样的一次性匿名邮箱,后缀很多,非常适合测试使用,下面分享几个比较好用的临时邮箱。 Gmail...

免费AI视频生成软件FramePack整合包下载,本地离线AI图片转视频工具
前段时间阿里开源了一个AI视频生成工具WAN2.1,可以实现文本转视频和图片转视频,虽说很强大,但是测试之后感觉软件对电脑配置要求太高了,感觉应该大部分用户都用不了,而且只支持720P视频,清晰度有些低,所以没和大家分享。前些天又出了一个更...

PDF OCR图片文字内容识别软件OCRmyPDF下载,免费PDF扫描内容转可搜索可复制工具
本次和大家分享一个非常热门强大的PDF文件内容OCR识别软件OCRmyPDF,这个软件可以将PDF内不可搜索的图片和文字识别转换为可复制可搜索的文本,并对PDF文件进行优化。 OCRmyPDF介绍 OCRmyPDF 为扫描的 PDF 文件添...