腾讯混元三维世界重建系统WorldMirror 2.0通用3D三维资产重建工具下载-诺瓦小站

WorldMirror 2.0 是由腾讯混元（Hunyuan）团队开发的下一代通用三维世界重建系统，底层基于 HY-World-2.0 模型。它能够从一组普通照片或一段视频中，自动恢复出场景的三维结构，并生成多种形式的三维资产，包括：

我基于当前最新版源码制作了免安装一键启动整合包，功能略作优化，修复已知BUG，UI界面翻译调整

软件特点

只需提供围绕场景拍摄的多张照片（或一段视频），即可自动完成相机姿态估计、深度估计、法线估计，并融合为完整的三维场景。

内置视频抽帧工具，自动从视频中按指定间隔提取关键帧，无需手动预处理。

集成了天空检测模型，可自动识别并滤除天空区域，避免天空干扰三维重建质量；天空过滤开关可在界面中实时切换。

使用体素合并算法对高斯点云进行压缩，在保证质量的前提下显著减少高斯数量，降低文件体积和渲染开销。

自动检测场景中的边缘区域和低置信度预测，用户可通过开关控制是否滤除这些区域以获得更干净的模型。

应用界面分为：左栏（文件上传与终端）、右栏（三维可视化与重建控制）

组件	功能说明
上传视频或图片	支持上传多张图片（PNG/JPG/JPEG/WebP/HEIC）或视频文件（MP4/AVI/MOV/MKV 等）。支持批量上传。
视频采样间隔（秒）	当上传视频时，此滑块控制每隔多少秒抽取一帧。值越大，抽帧越少；建议对运动缓慢的场景用 1.0-2.0 秒，快速运动的场景用 0.5-1.0 秒。
重新采样	仅对视频有效。调整采样间隔后点击此按钮，按新的间隔重新抽取视频帧。
图片预览	显示已上传/抽取的所有图片，方便确认输入数据。
终端输出	显示运行过程中的实时日志（模型加载、推理进度、保存状态等），便于排查问题。

标签页	功能说明
3D 高斯泼溅	以高斯泼溅形式展示三维场景。支持鼠标拖拽旋转、滚轮缩放，交互流畅。这是最高质量的渲染效果。
点云 / 网格	以三角网格或点云形式展示场景的几何结构。同样支持鼠标交互查看。可通过下方的重建选项切换显示模式。
深度图	逐帧查看每张输入图像对应的深度估计结果。拖动滑块切换不同帧，深度值以伪彩色显示（暖色近、冷色远）。
法线图	逐帧查看每张图像对应的法线估计结果。RGB 颜色编码了表面的朝向信息。
相机参数	可下载所有输入图像对应的相机位姿和相机内参 JSON 文件，格式兼容 COLMAP。

选项	说明
显示相机	在 3D 场景中显示相机图标/位置，便于理解每张照片的拍摄视角。
显示网格	切换点云/网格标签页的显示方式为三角网格（勾选）或原始点云（取消勾选）。
过滤低置信度 & 边缘	自动检测并滤除重建质量较低的区域和深度不连续边缘。开启后模型更干净但可能丢失部分细节。
过滤天空背景	开启后自动识别并移除天空区域。对于室外场景建议开启，室内场景可关闭。

注意：以上选项修改后会自动刷新 3D 场景，无需重新运行推理。

重建完成后，在 output/ 目录下会生成以时间戳命名的文件夹，包含：

文件	说明
`scene_xxx.glb`	三维场景模型文件（点云/网格），可在浏览器或 Blender 中打开
`gaussians.ply`	高斯泼溅点云文件，可用 3DGS 查看器渲染
`camera_params.json`	相机参数（位姿 + 内参），COLMAP 兼容格式
`predictions.npz`	完整的推理结果（深度、法线、掩码等），可用于二次分析
`images/`	输入图片目录
`depth/`、`normals/`	每帧对应的深度图、法线图 PNG 文件
`sky_mask/`	天空区域掩码 PNG 文件