本工具是一款面向 AI 视频生成创作者的本地离线辅助软件。用户导入任意视频文件,工具会自动完成场景检测、关键帧提取、多模态模型分析、提示词拼装等全流程,最终输出一份可直接复制粘贴到即梦 AI 等视频生成平台的完整提示词。
核心理念:把”看视频写提示词”的体力活交给 AI,让创作者专注于创意本身。
适用场景
- 看到喜欢的视频风格/运镜,想反推出可复用的提示词
- 需要将自己的成品视频转为提示词,用于二次迭代创作
- 批量分析视频素材库,建立个人提示词资产库
功能特点
1. ⚡ 全流程一键自动化
从上传视频到输出提示词,中间无需人工干预:
上传视频 → 场景检测 → 关键帧提取 → AI逐帧分析 → 综合汇总 → 生成提示词
2. 🧠 三层混合智能抽帧策略
采用先进的帧提取算法,确保捕捉到视频中的每一个关键瞬间:
| 层级 | 方法 | 作用 |
|---|---|---|
| 第1层 | PySceneDetect 场景切换检测 | 精准定位镜头切换点,每个切换点前后各取1帧 |
| 第2层 | Farneback 稠密光流法 | 每0.1秒采样,自动计算自适应运动阈值,捕捉爆炸/打击/特效等高动态瞬间 |
| 第3层 | pHash 感知哈希去重 | 相似度 > 90% 的帧自动去重,避免重复分析 |
自适应帧数上限,按运动强度排序保留:
| 视频时长 | 最大帧数 | 说明 |
|---|---|---|
| < 20秒 | 60帧 | 短片段精细覆盖 |
| 20~60秒 | 120帧 | 中等长度全面覆盖 |
| > 60秒 | 不限 | 长视频完整保留,不遗漏 |
3. 🏗️ 结构化专业分析维度
每帧从 8 个维度深度解析,涵盖即梦 AI 提示词所需全部要素:
- 【主体】 画面中的主要人物或物体
- 【动作】 主体正在进行的动作或运动状态
- 【环境】 场景背景、地点、时间(白天/夜晚)
- 【镜头】 镜头类型(特写/中景/全景/俯视/仰视/跟踪/慢动作等)
- 【风格】 画面整体风格(写实/赛博朋克/古风/玄幻/电影感等)
- 【光效】 光线类型(丁达尔光/霓虹灯/火焰光/冷月光/爆炸光等)
- 【色调】 整体色彩倾向(冷色调/暖色调/高对比/低饱和等)
- 【特效】 画面中出现的特效元素(粒子/能量/烟雾/爆炸/魔法等)
4. 📋 即梦 AI 一键复制输出
最终提示词采用标准格式,可直接粘贴到即梦等平台使用:
[整体设定](涵盖风格/主体/环境/光影等)
[镜头 | 时间段]
主体:xxx
动作:xxx
环境:xxx
镜头:xxx
风格:xxx
光效:xxx
色调:xxx
特效:xxx
5. 🚀 本地部署,数据安全
- 所有计算在本地完成,视频和画面不上传云端
- 基于 vLLM + Qwen3.5本地推理
- 支持 4B / 9B / 2B / 0.8B 四种模型规格,按需选择
6. 🔧 模型自动下载
- 通过 ModelScope 自动下载所选模型(首次使用需等待下载完成)
- 下载后缓存到本地,后续使用无需重复下载
7. 🖥️ 直观的 Gradio 图形界面
- 视频上传 + 模型选择 + 一键分析
- 关键帧画廊预览
- 各镜头分析结果
- 完整提示词输出(带一键复制按钮)
- 处理进度条实时反馈
快速开始
第1步:启动 vLLM 推理服务
双击 0启动vllm.bat,等待终端显示 vLLM 服务启动完成。
- 首次启动会自动通过 ModelScope 下载所选模型,请保持网络通畅
- 看到
Uvicorn running on http://127.0.0.1:8000即为启动成功 - 默认使用 bfloat16 精度(自动检测 GPU 兼容性,不支持的显卡自动回退 float16)
第2步:打开 Gradio 操作界面
双击 1启动UI.bat,稍等片刻浏览器将自动打开操作界面。
- 如未自动打开,手动访问
http://127.0.0.1:7860 - 界面标题:本地视频提示词反推工具
第3步:开始分析
- 上传视频 — 点击视频上传区域选择视频文件
- 选择模型 — 在下拉框中选择 Qwen3.5 模型规格
- 点击”🚀 开始分析” — 等待进度条走完
- 查看结果 — 左侧画廊展示提取的关键帧,右侧展示分析结果和完整提示词
- 复制提示词 — 点击完整提示词框的复制按钮,粘贴到即梦 AI 使用
模型说明
本工具默认使用 Qwen/Qwen3.5-4B,可选规格:
| 模型 | 显存需求 | 速度 | 分析质量 | 推荐场景 |
|---|---|---|---|---|
| Qwen3.5-0.8B | 2GB+ | ⚡⚡⚡⚡⚡ | ★★ | 快速预览、低配显卡 |
| Qwen3.5-2B | 4GB+ | ⚡⚡⚡⚡ | ★★★ | 一般分析需求 |
| Qwen3.5-4B | 8GB+ | ⚡⚡⚡ | ★★★★ | 默认推荐,平衡速度和效果 |
| Qwen3.5-9B | 16GB+ | ⚡⚡ | ★★★★★ | 追求最高分析精度 |
模型通过 config.json 持久化记录,每次启动自动加载上次选中的模型。
注意事项
⚠️ 使用须知
- 顺序要求:必须先启动
0启动vllm.bat,再启动1启动UI.bat,不可颠倒 - vLLM 启动等待:首次启动 vLLM 需要加载模型到 GPU,可能需要 1~5 分钟,
- 模型下载:首次使用新模型时,会自动通过 ModelScope 下载,下载速度取决于网络状况
- 显存占用:4B 模型约占用 8GB+ 显存,9B 模型约占用 16GB+ 显存,请确保显卡有足够余量
- 浏览器保持:使用过程中不要关闭浏览器标签页,否则进度会中断
- vLLM 端口冲突:如果 8000 端口被占用,请关闭占用程序后再启动
- 显卡温度:长时间连续分析大量视频时,请注意监控显卡温度
- 视频格式:支持主流视频格式(MP4、AVI、MOV、MKV 等),推荐使用 MP4 格式
AI视频提示词反推软件下载链接
https://pan.quark.cn/s/84f19aa7668b
相关推荐
BiliNote:自动生成B站油管视频笔记,AI视频内容总结工具
闲鱼自动回复机器人XianyuAutoAgent下载,24小时在线智能客服机器人系统
腾讯混元三维世界重建系统WorldMirror 2.0通用3D三维资产重建工具下载
PDF转word软件FreeP2W免安装版下载
图片/PDF转HTML/Markdown/JSON软件Chandra—— Windows 版一键启动包,免安装部署,可离线
openclaw AI助手windows电脑安装部署及微信聊天配置详细教程
Apple苹果3D 高斯(3DGS)模型ply文件生成器,图片转3D模型软件下载
字节跳动Dolphin图片文档解析工具免安装一键启动整合包下载,PDF转JSON/Markdown软件
最近更新

AI视频提示词反推工具,参考视频即梦提示词一键生成
本工具是一款面向 AI 视频生成创作者的本地离线辅助软件。用户导入任意视频文件,工具会自动完成场景检测、关键帧提取、多模态模型分析、提示词拼装等全流程,最终输出一份可直接复制粘贴到即梦 AI 等视频生成平台的完整提示词。 适用场景 功能特点...
免费在线HTML转markdown工具
经常看一些在线文档,想复制给AI参考的话不方便直接复制,转换成markdown再给AI阅读会更简单明了,也方便自己查阅,这里给大家推荐两个在线的免费HTML转markdown网站。 1、https://d1tools.com/tools/c...

闲鱼自动回复机器人XianyuAutoAgent下载,24小时在线智能客服机器人系统
XianyuAutoAgent是一款面向闲鱼平台的智能化自动回复机器人,利用大语言模型自动识别买家意图并生成专业回复,实现 7×24 小时智能客服。 主要功能 1. 智能自动回复 2. 可视化 Web UI 3. 人工接管模式 4. 安全防...

AI漫剧制作即梦seedance2.0教程及提示词2026年5月最新版分享
AI视频依旧持续火爆,各种类型的AI视频层出不穷,视频效果也是越来越好,甚至快接近影视级,目前最主要的AI视频生成工具还是即梦,即梦 Seedance 2.0生成视频一秒钟都到2块多钱了😂,不过也没办法,还是得用,目前还没能有替代即梦see...

AI实时语音聊天对话系统,外语口语陪练/虚拟好友实时语音交流
AI 实时语音对话系统 是一款集语音识别(ASR)、大语言模型(LLM)对话、语音合成(TTS)于一体的实时语音交互软件。用户通过麦克风说话,系统自动识别语音内容并转为文字,交由 AI 角色进行智能回复,最终将回复内容合成为语音实时播放,实...

ComfyUI 三参考图生图工作流,虚拟试衣、换脸、图片内容整合
本工作流核心能力是将三张不同角度、内容的参考图,通过 AI 理解融合,生成一张新的图像,新图像内容根据描述词指令生成。工作流集成了阿里巴巴的 Qwen2.5-VL 多模态大模型(图像编辑版本)与 SeedVR2 超分辨率放大模型,实现了「理...
comfyui CUDA128+torch 2.8.0+python3.12最新纯净版一键启动整合包
comfyui官方发布的最新版便携包是基于torch 2.11+CU130 +Python 3.13版本制作的,Python版本和torch版本都太新了,windows电脑上安装某些节点的时候会有冲突报错,有时候就算能安装上也会比较麻烦,感...
LTX2.3+comfyui音频驱动视频生成工作流
这是一个基于 ComfyUI 的 LTX 2.3 音视频同步生成工作流,核心功能是上传一段音频 + 参考图片(可多张图),自动生成与音频内容对应的视频,适合制作人物说话、唱歌等口型同步视频。工作流使用8位量化版ltx2.3模型,显存需求降低...
LTX2.3+comfyui分段提示词图片转视频工作流,AI视频带货生成器
再和大家分享一个基于 ComfyUI 的 AI 分段提示词图生视频工作流,本工作流主要基于模型LTX2.3和PromptRelay实现。可使用PromptRelay分时段控制生成不同视频画面或合成语音内容。 📌 工作流简介 本工作流是一套基...
windows电脑C盘垃圾查找清理软件
电脑用了好几年了,尽管我安装软件从来不主动装到C盘,偶尔也会清理垃圾,但是用的久了,容量也是在慢慢减少。我C盘303G,现在就剩了24G了,已经会影响到系统性能和虚拟内存调度了,已经不能不管了。C盘不装软件的话大多都是缓存,文件太多了,有时...














