
免费音频视频语音识别转文字软件SenseVoice整合包,支持批量操作可生成字幕
本次分享的是阿里团队退出的一款快速免费语音识别转文字软件SenseVoice,以前分享过paraformer-zh-streaming模型的实时识别版,本次的是SenseVoiceSmall模型非实时识别版,本人二次开发优化版,可识别音频视...
本次分享的是阿里团队退出的一款快速免费语音识别转文字软件SenseVoice,以前分享过paraformer-zh-streaming模型的实时识别版,本次的是SenseVoiceSmall模型非实时识别版,本人二次开发优化版,可识别音频视...
faster-whisper是基于OpenAI的whisper的优化版本,faster-whisper使用CTranslate2对 OpenAI 的 Whisper 模型的重新实现,它是 Transformer 模型的快速推理引擎。在相同准...
CosyVoice是阿里团队推出的一款强大的TTS文字转语音工具,支持3秒声音复刻,跨语种复刻,情感语音合成等功能,支持几十种语言,合成速度快,发音流畅自然,非常的强大。本软件为免费开源软件,原项目地址:https://github.com...
Marker是另一款比较热门的PDF格式文件转Markdown文件的软件,之前介绍过一个软件MinerU:《PDF转md格式软件MinerU整合包下载,一键pdf批量转markdown免费工具》,Marker相对来说操作更简单一些,也比较受...