目前最强免费开源AI绘画工具flux本地部署教程,创作超逼真写实照片
flux是目前非常火的,也是非常强大的一款文本到图像生成模型,该项目由黑森林实验室(Black Forest Labs)开发,经过之前的多代版本模型开发迭代,flux生成的图片可以说质量非常的高,支持生成各种尺寸图片,最大图片可达8192&...
flux是目前非常火的,也是非常强大的一款文本到图像生成模型,该项目由黑森林实验室(Black Forest Labs)开发,经过之前的多代版本模型开发迭代,flux生成的图片可以说质量非常的高,支持生成各种尺寸图片,最大图片可达8192&...
EchoMimic是一个可以让照片开口说话的应用,说话内容为你提供的音频,之前网络上出现比较多的复活逝去亲人,或是制作一些娱乐视频,都可以使用本应用实现,本应用为免费开源应用, EchoMimic配置参数说明: 宽度和高度:决定了最终生成的...
今天和大家分享一个本人制作的电脑语音打字软件,软件通过接收你说话的声音,识别出文字,然后输入到word文档中,相当于一个说话打字输入法,直接说话就能打字,当然也支持手动打字输入内容。软件操作界面如下: 软件只支持docx格式的word文档 ...
扩图应用diffusers-image-outpaint是一种基于扩散模型的图像生成方法。它能根据原图像内容,继续生成图像的外部区域,增加图片尺寸,增加图片内容,新生成的图片非常自然完整。在某些使用场景需要修改图片尺寸或是图片内容时,可使用...
visual-try-on是一款免费的AI一键换衣应用,该项目为免费开源项目,但作者还未完全发布源码,只发布了Chrome扩展版, Chrome 扩展程序visual-try-on可使用户使用人工智能图像处理技术在任何电子商务网站上虚拟试穿...
这次分享的是本人二次开发优化后的V3版本语音识别转文字软件,V3版本更新内容如下: 音视频文件识别版: 1、优化字幕生成算法,生成的字幕时间戳更准确, 2、新增批量识别功能,可将选定的文件夹内的音频视频文件依次进行识别, 3、新增热词定制功...
本篇分享的是目前速度最快的免费语音识别转文字软件,本人二次开发优化的V2版本,可识别音频视频转为文字,支持生成字幕,支持识别文本翻译为其它语言文本。支持实时语音识别,支持实时语音翻译,可实时将接收到的语音识别并翻译为其它语言,支持实时显示翻...
faster-whisper是基于OpenAI的whisper的优化版本,faster-whisper使用CTranslate2对 OpenAI 的 Whisper 模型的重新实现,它是 Transformer 模型的快速推理引擎。在相同准...
CosyVoice是阿里团队推出的一款强大的TTS文字转语音工具,支持3秒声音复刻,跨语种复刻,情感语音合成等功能,支持几十种语言,合成速度快,发音流畅自然,非常的强大。本软件为免费开源软件,原项目地址:https://github.com...
Marker是另一款比较热门的PDF格式文件转Markdown文件的软件,之前介绍过一个软件MinerU:《PDF转md格式软件MinerU整合包下载,一键pdf批量转markdown免费工具》,Marker相对来说操作更简单一些,也比较受...