前段时间阿里开源了一个AI视频生成工具WAN2.1,可以实现文本转视频和图片转视频,虽说很强大,但是测试之后感觉软件对电脑配置要求太高了,感觉应该大部分用户都用不了,而且只支持720P视频,清晰度有些低,所以没和大家分享。前些天又出了一个更牛的AI视频生成软件FramePack,这个软件英伟达显卡显存6G即可体验,远远降低了使用门槛,我基于当前最新版本制作了一键启动整合包。

FramePack介绍
FramePack 是一个渐进式生成视频的下一帧(下一帧部分)预测神经网络结构。
FramePack 将输入上下文压缩为恒定长度,以便生成工作量不受视频长度的影响。
即使在笔记本电脑 GPU 上,FramePack 也可以使用 13B 模型处理大量帧。
FramePack 可以使用更大的批量大小进行训练,类似于图像扩散训练的批量大小。
视频扩散,但感觉像图像扩散。
FramePack-F1
FramePack-F1是一种仅通过历史帧预测未来帧的FramePack模型。
“F1″代表”前向”版本1,表明其预测方向(该模型仅进行正向预测,而非反向预测)。这种单向预测模型相比默认的双向模型具有更少的约束条件,因此能呈现更大的变化幅度和更丰富的动态效果。像提示词穿梭这类应用场景应该会获得更佳效果。
但构建此类模型的主要挑战在于如何防止视频生成过程中出现漂移现象(或称误差累积)。该模型采用了一项新型抗漂移调控技术进行训练,相关论文将很快在Arxiv平台更新。

FramePack整合包使用教程

首先将网盘内的软件压缩包下载到本地电脑上并解压,首先需要下载模型,先点击下载模型后面1.0按钮下载模型,如果你想使用F1版,也需要先下载1.0版模型,然后再下载F1版模型。模型非常大,超过了40G,如果下载所有版本模型文件的话,总共硬盘空间占用约65G。
模型从魔塔站点下载,国内速度非常快,不会需要太久,等到黑色终端窗口里输出模型下载完成提示信息的时候,就是下载完成了,如果没提示输出下载完成信息的话就是没下载完,如果报错终止的话,可以重新运行下载程序继续接着之前进度下载。
点击按钮启动webUI,启动时会加载模型,请耐心等待,启动完成后会自动打开webui界面。
先上传一张参考图片,然后在prompt提示词输入框里输入想要生成视频的画面内容描述,然后点击start generate 开始合成视频。
默认视频时长是5秒,最大可生成120秒视频,可通过参数Total Video Length (Seconds)设置。
其它参数保持默认即可
整合包修改内容:
增加了对20系列显卡的支持
模型下载站点由原来国外的huggingface改为国内的魔塔,方便国内用户使用
其它部分细节上的修改
注意事项
虽然官方文档说明6G显存可用,但是速度极慢,建议英伟达显卡显存6G以上用户体验
内存大于32G
只支持windows10或11
软件运行路径中不要有非英文字符和空格,待处理文件同样要注意
免费AI视频生成软件FramePack下载链接
相关推荐
FlashVSR低分辨率模糊视频高清放大工具整合包v1.1下载,免安装一键启动
人物动作迁移及视频人物替换软件Wan2.2-Animate-14B整合包下载,动作模仿视频换主体工具在线一键启动
无限长度的数字人对话视频生成软件InfiniteTalk整合包,图像转视频、视频配音对口型工具
Wan2.2-S2V-14B:音频驱动图片转视频生成本地整合包及在线一键启动
2D照片转3D视频软件stable-virtual-camera免安装一键启动整合包下载
免费图片视频摄像头换脸软件VisoMaster整合包下载,面部表情实时调节预览
免费图片视频人像模糊老旧照片变高清软件CodeFormer整合包下载
视频人物抠像软件MatAnyone整合包下载,AI视频抠图工具
最近更新

FunASR语音识别转文字软件区分说话人版
FunASR是一款优秀的基础语音识别框架,配合阿里通义团队开发的其它语音识别模型,能够实现非常好语音转文字效果,尤其在中文语音识别方面,鉴于有些用户需要对语音识别内容区分说话人,我重新做了一版区分说话人的版本。软件支持多语言识别,但是还是尽...

windows系统电脑通过WSL2安装OpenClwa实现开机自动启动详细教程
windows系统原生环境下运行openclaw多少还是会遇到点问题,虽然windows原生环境支持使用,但是WSL2仍是官方最推荐的方式。下面是windows系统电脑安装WSL2及OpenClaw详细教程。 安装 WSL2 以管理员身份打...

openclaw AI助手windows电脑安装部署及微信聊天配置详细教程
openclaw是目前最火爆的开源应用,没有之一,它功能强大远超同类应用。以前AI只是你问它答,OpenClaw可以说是有了手,可以帮你做事,做很多事,如果利用的好,绝对是个利器。下面分享一下windows系统电脑本地安装部署教程,有时候可...

Apple苹果3D 高斯(3DGS)模型ply文件生成器,图片转3D模型软件下载
ml-sharp是Apple苹果团队开发的一款3D高斯(3DGS)生成器,可将图片生成3D效果的ply文件。我基于当前最新版本制作了免安装一键启动整合包。 ml-sharp官方介绍 我们提出了 SHARP,这是一种从单张图像进行照片级逼真视...

字节跳动Dolphin图片文档解析工具免安装一键启动整合包下载,PDF转JSON/Markdown软件
本次再分享一个由字节跳动团队开发的一款图片文档解析工具Dolphin,支持解析表格、公式、文本、代码块等元素,支持图片和PDF文档转为Markdown和JSON格式文件,当前为最新发布的V2版本,各项功能效果都得到较大提升。 Dolphin...

微软最新图片转3D网格模型软件TRELLIS.2 windows版整合包下载,AI一键建模工具
上个月微软发布了图片转3D网格模型软件TRELLIS的2.0版本。之前1.0版本非常受欢迎,当前2.0版本功能更强大,效果更好。我制作了最新windows版免安装一键启动整合包。 TRELLIS.2官方说明 TRELLIS.2 是一款最先进...

FunASR最新模型FunAudioLLM/Fun-ASR-Nano-2512实时语音识别转文字热词版整合包下载
Fun-ASR-Nano-2512是阿里通义实验室前天刚发布的最新最强的一款语音识别转文字模型,支持31种语言,延迟低,在某些专业领域表现出色。我基于FunAudioLLM/Fun-ASR-Nano-2512模型制作了最新实时语音识别转文字...

Crawl4AI:基于AI大语言模型的网络爬虫和数据抓取工具整合包软件下载
Crawl4AI是一款基于AI大语言模型能力的网络爬虫和数据抓取软件,可以将网页转换为简洁、符合 LLM 规范的 Markdown 格式,适用于 RAG、代理和数据管道。它速度快、可控性强。 Crawl4AI官方介绍 开源的 LLM 友好型...

browser-use浏览器任务全自动化AI助手windows电脑版一键启动整合包
本次再和大家分享一个非常牛逼的AI助手软件:browser-use,别问哪里牛逼,反正很多人都在用,社区starts高达72.8K,火遍全球的deepseek 100K,browser-use 72.8K,就问你火不火。之前我也分享过其它类...

FlashVSR低分辨率模糊视频高清放大工具整合包v1.1下载,免安装一键启动
FlashVSR-一款高性能可靠的视频超高分辨率放大工具。迈向基于扩散的实时流式视频超分辨率——一种高效的单步扩散框架,用于具有局部约束稀疏注意力和小型条件解码器的流式VSR。 FlashVSR官方介绍 扩散模型最近在视频修复方面取得了进展...










