AI软件下载
有趣网站推荐及实用软件下载

AI视频提示词反推工具,参考视频即梦提示词一键生成

本工具是一款面向 AI 视频生成创作者的本地离线辅助软件。用户导入任意视频文件,工具会自动完成场景检测、关键帧提取、多模态模型分析、提示词拼装等全流程,最终输出一份可直接复制粘贴到即梦 AI 等视频生成平台的完整提示词。

核心理念:把”看视频写提示词”的体力活交给 AI,让创作者专注于创意本身。

AI视频提示词反推工具,参考视频即梦提示词一键生成

适用场景

  • 看到喜欢的视频风格/运镜,想反推出可复用的提示词
  • 需要将自己的成品视频转为提示词,用于二次迭代创作
  • 批量分析视频素材库,建立个人提示词资产库

功能特点

1. ⚡ 全流程一键自动化

从上传视频到输出提示词,中间无需人工干预:

上传视频 → 场景检测 → 关键帧提取 → AI逐帧分析 → 综合汇总 → 生成提示词

2. 🧠 三层混合智能抽帧策略

采用先进的帧提取算法,确保捕捉到视频中的每一个关键瞬间:

层级方法作用
第1层PySceneDetect 场景切换检测精准定位镜头切换点,每个切换点前后各取1帧
第2层Farneback 稠密光流法每0.1秒采样,自动计算自适应运动阈值,捕捉爆炸/打击/特效等高动态瞬间
第3层pHash 感知哈希去重相似度 > 90% 的帧自动去重,避免重复分析

自适应帧数上限,按运动强度排序保留:

视频时长最大帧数说明
< 20秒60帧短片段精细覆盖
20~60秒120帧中等长度全面覆盖
> 60秒不限长视频完整保留,不遗漏

3. 🏗️ 结构化专业分析维度

每帧从 8 个维度深度解析,涵盖即梦 AI 提示词所需全部要素:

  • 【主体】 画面中的主要人物或物体
  • 【动作】 主体正在进行的动作或运动状态
  • 【环境】 场景背景、地点、时间(白天/夜晚)
  • 【镜头】 镜头类型(特写/中景/全景/俯视/仰视/跟踪/慢动作等)
  • 【风格】 画面整体风格(写实/赛博朋克/古风/玄幻/电影感等)
  • 【光效】 光线类型(丁达尔光/霓虹灯/火焰光/冷月光/爆炸光等)
  • 【色调】 整体色彩倾向(冷色调/暖色调/高对比/低饱和等)
  • 【特效】 画面中出现的特效元素(粒子/能量/烟雾/爆炸/魔法等)

4. 📋 即梦 AI 一键复制输出

最终提示词采用标准格式,可直接粘贴到即梦等平台使用:

[整体设定](涵盖风格/主体/环境/光影等)

[镜头 | 时间段]
主体:xxx
动作:xxx
环境:xxx
镜头:xxx
风格:xxx
光效:xxx
色调:xxx
特效:xxx

5. 🚀 本地部署,数据安全

  • 所有计算在本地完成,视频和画面不上传云端
  • 基于 vLLM + Qwen3.5本地推理
  • 支持 4B / 9B / 2B / 0.8B 四种模型规格,按需选择

6. 🔧 模型自动下载

  • 通过 ModelScope 自动下载所选模型(首次使用需等待下载完成)
  • 下载后缓存到本地,后续使用无需重复下载

7. 🖥️ 直观的 Gradio 图形界面

  • 视频上传 + 模型选择 + 一键分析
  • 关键帧画廊预览
  • 各镜头分析结果
  • 完整提示词输出(带一键复制按钮)
  • 处理进度条实时反馈

快速开始

第1步:启动 vLLM 推理服务

双击 0启动vllm.bat,等待终端显示 vLLM 服务启动完成。

  • 首次启动会自动通过 ModelScope 下载所选模型,请保持网络通畅
  • 看到 Uvicorn running on http://127.0.0.1:8000 即为启动成功
  • 默认使用 bfloat16 精度(自动检测 GPU 兼容性,不支持的显卡自动回退 float16)

第2步:打开 Gradio 操作界面

双击 1启动UI.bat,稍等片刻浏览器将自动打开操作界面。

  • 如未自动打开,手动访问 http://127.0.0.1:7860
  • 界面标题:本地视频提示词反推工具

第3步:开始分析

  1. 上传视频 — 点击视频上传区域选择视频文件
  2. 选择模型 — 在下拉框中选择 Qwen3.5 模型规格
  3. 点击”🚀 开始分析” — 等待进度条走完
  4. 查看结果 — 左侧画廊展示提取的关键帧,右侧展示分析结果和完整提示词
  5. 复制提示词 — 点击完整提示词框的复制按钮,粘贴到即梦 AI 使用

模型说明

本工具默认使用 Qwen/Qwen3.5-4B,可选规格:

模型显存需求速度分析质量推荐场景
Qwen3.5-0.8B2GB+⚡⚡⚡⚡⚡★★快速预览、低配显卡
Qwen3.5-2B4GB+⚡⚡⚡⚡★★★一般分析需求
Qwen3.5-4B8GB+⚡⚡⚡★★★★默认推荐,平衡速度和效果
Qwen3.5-9B16GB+⚡⚡★★★★★追求最高分析精度

模型通过 config.json 持久化记录,每次启动自动加载上次选中的模型。


注意事项

⚠️ 使用须知

  1. 顺序要求:必须先启动 0启动vllm.bat,再启动 1启动UI.bat,不可颠倒
  2. vLLM 启动等待:首次启动 vLLM 需要加载模型到 GPU,可能需要 1~5 分钟,
  3. 模型下载:首次使用新模型时,会自动通过 ModelScope 下载,下载速度取决于网络状况
  4. 显存占用:4B 模型约占用 8GB+ 显存,9B 模型约占用 16GB+ 显存,请确保显卡有足够余量
  5. 浏览器保持:使用过程中不要关闭浏览器标签页,否则进度会中断
  6. vLLM 端口冲突:如果 8000 端口被占用,请关闭占用程序后再启动
  7. 显卡温度:长时间连续分析大量视频时,请注意监控显卡温度
  8. 视频格式:支持主流视频格式(MP4、AVI、MOV、MKV 等),推荐使用 MP4 格式

AI视频提示词反推软件下载链接

https://pan.quark.cn/s/84f19aa7668b


AI软件用不了?2元爽玩4090: 立即体验>>

热门大语言模型API免费体验: 立即获取>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(0) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

免费在线HTML转markdown工具

经常看一些在线文档,想复制给AI参考的话不方便直接复制,转换成markdown再给AI阅读会更简单明了,也方便自己查阅,这里给大家推荐两个在线的免费HTML转markdown网站。 1、https://d1tools.com/tools/c...

LTX2.3+comfyui音频驱动视频生成工作流

这是一个基于 ComfyUI 的 LTX 2.3 音视频同步生成工作流,核心功能是上传一段音频 + 参考图片(可多张图),自动生成与音频内容对应的视频,适合制作人物说话、唱歌等口型同步视频。工作流使用8位量化版ltx2.3模型,显存需求降低...

windows电脑C盘垃圾查找清理软件

电脑用了好几年了,尽管我安装软件从来不主动装到C盘,偶尔也会清理垃圾,但是用的久了,容量也是在慢慢减少。我C盘303G,现在就剩了24G了,已经会影响到系统性能和虚拟内存调度了,已经不能不管了。C盘不装软件的话大多都是缓存,文件太多了,有时...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫