WorldMirror 2.0 是由腾讯混元(Hunyuan)团队开发的下一代通用三维世界重建系统,底层基于 HY-World-2.0 模型。它能够从一组普通照片或一段视频中,自动恢复出场景的三维结构,并生成多种形式的三维资产,包括:
- 点云 / 网格(Mesh)模型:场景的几何结构重建
- 3D 高斯泼溅(Gaussian Splatting):高质量的神经渲染表示
- 深度图 / 法线图:每帧对应的几何信息
- 相机参数:每张图像的位姿与内参
我基于当前最新版源码制作了免安装一键启动整合包,功能略作优化,修复已知BUG,UI界面翻译调整

软件特点
1. 多视角三维重建
只需提供围绕场景拍摄的多张照片(或一段视频),即可自动完成相机姿态估计、深度估计、法线估计,并融合为完整的三维场景。
2. 支持多种输出形式
- GLB 格式的三维网格/点云模型:可直接在浏览器中交互查看,也支持导入 Blender、Unity 等软件
- 3D 高斯泼溅(3DGS):新一代神经渲染技术,渲染质量高、速度快,适合高质量可视化展示
- 每帧深度图与法线图:可用于后续的二次编辑或分析
- 相机参数导出:支持 COLMAP 格式的相机位姿与内参,方便对接传统三维重建管线
3. 支持视频输入
内置视频抽帧工具,自动从视频中按指定间隔提取关键帧,无需手动预处理。
4. 天空背景检测与过滤
集成了天空检测模型,可自动识别并滤除天空区域,避免天空干扰三维重建质量;天空过滤开关可在界面中实时切换。
5. 高斯泼溅体素合并优化
使用体素合并算法对高斯点云进行压缩,在保证质量的前提下显著减少高斯数量,降低文件体积和渲染开销。
6. 边缘与低置信度过滤
自动检测场景中的边缘区域和低置信度预测,用户可通过开关控制是否滤除这些区域以获得更干净的模型。
WorldMirror 2.0应用界面功能详解
应用界面分为:左栏(文件上传与终端)、右栏(三维可视化与重建控制)
左栏:文件上传
| 组件 | 功能说明 |
|---|---|
| 上传视频或图片 | 支持上传多张图片(PNG/JPG/JPEG/WebP/HEIC)或视频文件(MP4/AVI/MOV/MKV 等)。支持批量上传。 |
| 视频采样间隔(秒) | 当上传视频时,此滑块控制每隔多少秒抽取一帧。值越大,抽帧越少;建议对运动缓慢的场景用 1.0-2.0 秒,快速运动的场景用 0.5-1.0 秒。 |
| 重新采样 | 仅对视频有效。调整采样间隔后点击此按钮,按新的间隔重新抽取视频帧。 |
| 图片预览 | 显示已上传/抽取的所有图片,方便确认输入数据。 |
| 终端输出 | 显示运行过程中的实时日志(模型加载、推理进度、保存状态等),便于排查问题。 |
右栏:三维可视化与重建控制
顶部状态栏
- 显示当前操作状态提示(如”请上传文件,然后点击开始重建”、”正在重建中…”、”重建成功”等)。
查看标签页
| 标签页 | 功能说明 |
|---|---|
| 3D 高斯泼溅 | 以高斯泼溅形式展示三维场景。支持鼠标拖拽旋转、滚轮缩放,交互流畅。这是最高质量的渲染效果。 |
| 点云 / 网格 | 以三角网格或点云形式展示场景的几何结构。同样支持鼠标交互查看。可通过下方的重建选项切换显示模式。 |
| 深度图 | 逐帧查看每张输入图像对应的深度估计结果。拖动滑块切换不同帧,深度值以伪彩色显示(暖色近、冷色远)。 |
| 法线图 | 逐帧查看每张图像对应的法线估计结果。RGB 颜色编码了表面的朝向信息。 |
| 相机参数 | 可下载所有输入图像对应的相机位姿和相机内参 JSON 文件,格式兼容 COLMAP。 |
重建按钮
- 开始重建:点击后启动世界重建流程。处理时间取决于图片数量和分辨率,通常从数十秒到数分钟不等。
- 清除:一键清除所有上传文件和重建结果,重置界面。
帧选择器
- 显示指定帧的点云:默认为”All”(显示所有帧),可切换为特定帧,仅显示该帧视角下的点云数据。
重建选项(不适用于 3DGS)
| 选项 | 说明 |
|---|---|
| 显示相机 | 在 3D 场景中显示相机图标/位置,便于理解每张照片的拍摄视角。 |
| 显示网格 | 切换点云/网格标签页的显示方式为三角网格(勾选)或原始点云(取消勾选)。 |
| 过滤低置信度 & 边缘 | 自动检测并滤除重建质量较低的区域和深度不连续边缘。开启后模型更干净但可能丢失部分细节。 |
| 过滤天空背景 | 开启后自动识别并移除天空区域。对于室外场景建议开启,室内场景可关闭。 |
注意:以上选项修改后会自动刷新 3D 场景,无需重新运行推理。
注意事项
1. 输入图片要求
- 数量:图片越多,重建质量越好,生成耗时越久。
- 覆盖:拍摄时应围绕场景从不同角度拍摄,确保每部分至少有 2-3 张图片覆盖。
- 重叠:相邻图片之间应有 60% 以上的视野重叠。
- 清晰度:避免运动模糊或过暗的图片。
- 格式:支持 PNG、JPG、JPEG、WebP、HEIC/HEIF。
2. 视频输入建议
- 拍摄时保持匀速移动,避免剧烈抖动。
- 采样间隔建议:慢速环绕拍摄用 1.0-2.0 秒,手持步行拍摄用 0.5-1.0 秒。
- 视频总帧数建议控制在 50-200 帧之间。
3. 硬件要求
- GPU:建议 NVIDIA 显卡30系列起,显存 6GB 以上,显存越大性能越好
- 系统:windows 10 或 11
4. 运行时间
- 推理时间与图片数量、分辨率成正比。
- 体素合并和高斯点云优化在后处理阶段进行,通常耗时数秒。
5. 输出文件说明
重建完成后,在 output/ 目录下会生成以时间戳命名的文件夹,包含:
| 文件 | 说明 |
|---|---|
scene_xxx.glb | 三维场景模型文件(点云/网格),可在浏览器或 Blender 中打开 |
gaussians.ply | 高斯泼溅点云文件,可用 3DGS 查看器渲染 |
camera_params.json | 相机参数(位姿 + 内参),COLMAP 兼容格式 |
predictions.npz | 完整的推理结果(深度、法线、掩码等),可用于二次分析 |
images/ | 输入图片目录 |
depth/、normals/ | 每帧对应的深度图、法线图 PNG 文件 |
sky_mask/ | 天空区域掩码 PNG 文件 |
6. 已知限制
- 对纯色的、缺乏纹理的场景(如白墙、光滑地面)重建效果可能不佳。
- 透明/反射物体(玻璃、水面)可能产生不准确的深度估计。
- 输入图片尺寸过大会显著增加显存消耗,系统会自动缩放到合适的尺寸(最大 952px)。
- 高度动态的场景(人群中、车流中)可能导致重建失败。
腾讯混元WorldMirror 2.0整合包下载链接
https://pan.quark.cn/s/78597f48e361
相关推荐
Apple苹果3D 高斯(3DGS)模型ply文件生成器,图片转3D模型软件下载
微软最新图片转3D网格模型软件TRELLIS.2 windows版整合包下载,AI一键建模工具
高精度2D图片转3D网格模型软件Stable3DGen整合包下载
腾讯混元3D大模型2.1版图片文本转3D网格模型软件Hunyuan3D-2.1整合包
图片转3D模型软件Wonder3D整合包使用说明视频教程
微软2D图片/文本转3D模型软件TRELLIS整合包使用说明视频教程
微软图片转3D模型软件TRELLIS整合包下载,2D图片转3D GLB资产
图片转3D模型软件Wonder3D++整合包下载,AI一键生成3D网格建模工具
最近更新

最强PR中文视频自动语音识别生成字幕插件,语音识别准确率高支持多国语言
上次和大家分享了PR非常好用的自动剪辑口播视频静音片段插件,如果想要自动生成视频字幕的话,用PR自带的语音识别转字幕工具,效果非常差,语音识别准确率非常低,识别的文本差太多手动修改起来极其麻烦,反而更加浪费时间了。为了提高工作效率,降低人工...

祝贺凡人修仙传2026年新年番开播同时在线人数超64万
今天6月13日凡人修仙传新年番开播,同时在线人数破64万(非最高在线人数,只是我看到的在线人数),作为凡人5年老粉,必须发个帖祝贺一下。 我比较喜欢看动漫,各种类型看了很多,具体不清楚多少,像斗罗斗破之类看了一大半终究是没能看下去,还是雾山...

Premiere Pro静音片段自动剪辑插件——Silence Remover使用教程及下载
对于做口播、Vlog、播客剪辑的朋友来说,最耗时的工作之一就是手动找出视频中的”哑巴”片段——说话间隙、停顿、思考时的”嗯啊”——并逐一删除。今天给大家介绍一款来自 Phantom Edito...

蛙蛙写作-能替你"打工"的AI写作平台,附邀请码:UZekHC
我不是一个容易被工具说服的人。用过 ChatGPT、试过各种”AI写作神器”,大多数要么写出来全是机翻腔,要么根本不懂网文的爆款逻辑。 直到我开始用蛙蛙写作,才发现原来一个工具真的可以懂你想写什么。 🐸 蛙蛙写作是什...

PDFMathTranslate + MinerU 批量PDF全文双语翻译转Markdown工具
本工具是一款基于 PDFMathTranslate 与 MinerU 整合的桌面端 PDF 翻译工具,通过简洁的 Web 界面实现一键式 PDF 全文双语翻译,并可选择将翻译结果导出为 Markdown 格式,方便导入知识库或进行二次编辑。...

Claude居然自称“本人”
今天在和Claude聊网文写作的时候,Claude回复中居然自称本人,这让我有点震惊。 我经常会和AI聊工具功能对比等话题,ChatGPT、Gemini、Claude这些以前我记得从来没有自称过本人的,好像都是本模型,本工具等等,反正从来没...

图像无损放大神器:Topaz Gigapixel AI软件下载及使用指南
在数字内容创作成风头的今天,我们经常会遇到低分辨率素材模糊、AI 生成图片尺寸太小、或者老照片充满噪点的情况。传统的图像放大方式(如双三次插值)只是单纯地拉伸像素,容易让画面变得模糊、虚化。 如果你正在寻找一种能“凭空”补齐细节、让低画质瞬...

AI视频提示词反推工具,参考视频即梦提示词一键生成
本工具是一款面向 AI 视频生成创作者的本地离线辅助软件。用户导入任意视频文件,工具会自动完成场景检测、关键帧提取、多模态模型分析、提示词拼装等全流程,最终输出一份可直接复制粘贴到即梦 AI 等视频生成平台的完整提示词。 适用场景 功能特点...
免费在线HTML转markdown工具
经常看一些在线文档,想复制给AI参考的话不方便直接复制,转换成markdown再给AI阅读会更简单明了,也方便自己查阅,这里给大家推荐两个在线的免费HTML转markdown网站。 1、https://d1tools.com/tools/c...

闲鱼自动回复机器人XianyuAutoAgent下载,24小时在线智能客服机器人系统
XianyuAutoAgent是一款面向闲鱼平台的智能化自动回复机器人,利用大语言模型自动识别买家意图并生成专业回复,实现 7×24 小时智能客服。 主要功能 1. 智能自动回复 2. 可视化 Web UI 3. 人工接管模式 4. 安全防...














