音频驱动口型数字人视频制作软件VideoReTalking整合包,音频视频人物对口型
本次和大家分享一个音频驱动口型数字人视频制作工具VideoReTalking,这个软件可以根据一段音频对视频中的人物重新生成口型,可以实现音频口型同步,重新生成一段自然流畅的人物说话视频,本应用为免费开源应用。 VideoReTalking...
本次和大家分享一个音频驱动口型数字人视频制作工具VideoReTalking,这个软件可以根据一段音频对视频中的人物重新生成口型,可以实现音频口型同步,重新生成一段自然流畅的人物说话视频,本应用为免费开源应用。 VideoReTalking...
ChatPaper是一个免费的PDF论文全文总结及全文翻译软件,软件可以总结本地单个PDF文档或整个文件夹内的所有PDF文档,也可以从arxiv网站上搜索指定论文进行总结,加快获取知识理解知识的速度。作者开发意图:希望让语言不再成为中国人获...
flux是目前非常火的,也是非常强大的一款文本到图像生成模型,该项目由黑森林实验室(Black Forest Labs)开发,经过之前的多代版本模型开发迭代,flux生成的图片可以说质量非常的高,支持生成各种尺寸图片,最大图片可达8192&...
EchoMimic是一个可以让照片开口说话的应用,说话内容为你提供的音频,之前网络上出现比较多的复活逝去亲人,或是制作一些娱乐视频,都可以使用本应用实现,本应用为免费开源应用, EchoMimic配置参数说明: 宽度和高度:决定了最终生成的...
今天和大家分享一个本人制作的电脑语音打字软件,软件通过接收你说话的声音,识别出文字,然后输入到word文档中,相当于一个说话打字输入法,直接说话就能打字,当然也支持手动打字输入内容。软件操作界面如下: 软件只支持docx格式的word文档 ...
扩图应用diffusers-image-outpaint是一种基于扩散模型的图像生成方法。它能根据原图像内容,继续生成图像的外部区域,增加图片尺寸,增加图片内容,新生成的图片非常自然完整。在某些使用场景需要修改图片尺寸或是图片内容时,可使用...
visual-try-on是一款免费的AI一键换衣应用,该项目为免费开源项目,但作者还未完全发布源码,只发布了Chrome扩展版, Chrome 扩展程序visual-try-on可使用户使用人工智能图像处理技术在任何电子商务网站上虚拟试穿...
这次分享的是本人二次开发优化后的V3版本语音识别转文字软件,V3版本更新内容如下: 音视频文件识别版: 1、优化字幕生成算法,生成的字幕时间戳更准确, 2、新增批量识别功能,可将选定的文件夹内的音频视频文件依次进行识别, 3、新增热词定制功...
本篇分享的是目前速度最快的免费语音识别转文字软件,本人二次开发优化的V2版本,可识别音频视频转为文字,支持生成字幕,支持识别文本翻译为其它语言文本。支持实时语音识别,支持实时语音翻译,可实时将接收到的语音识别并翻译为其它语言,支持实时显示翻...
faster-whisper是基于OpenAI的whisper的优化版本,faster-whisper使用CTranslate2对 OpenAI 的 Whisper 模型的重新实现,它是 Transformer 模型的快速推理引擎。在相同准...