字节跳动Dolphin图片文档解析工具免安装一键启动整合包下载,PDF转JSON/Markdown软件-诺瓦小站

本次再分享一个由字节跳动团队开发的一款图片文档解析工具Dolphin，支持解析表格、公式、文本、代码块等元素，支持图片和PDF文档转为Markdown和JSON格式文件，当前为最新发布的V2版本，各项功能效果都得到较大提升。

文章目录 隐藏

1 Dolphin V2介绍

2 Dolphin V2整合包使用说明

3 注意事项

4 图片PDF文档解析工具Dolphin V2整合包下载链接

Dolphin V2介绍

Dolphin是由字节跳动（ByteDance）开发并开源的一款高性能、多模态的通用文档图像解析模型。该研究成果已被自然语言处理领域的顶级会议 ACL 2025 接收。

简单来说，Dolphin 是一个强大的“文档提取神器”，它可以将包含复杂排版（如文本、公式、表格、图片、代码块等）的 PDF 或文档图片，精准且高效地转化为结构化的 Markdown 或 JSON 格式数据。当前发布的整合包版本为最新的V2版本。

Model	Size	Overall↑	Text^Edit↓	Formula^CDM↑	Table^TEDS↑	Table^TEDS-S↑	Read Order^Edit↓
Dolphin	0.3B	74.67	0.125	67.85	68.70	77.77	0.124
Dolphin-1.5	0.3B	85.06	0.085	79.44	84.25	88.06	0.071
Dolphin-v2	3B	89.78	0.054	87.63	87.02	90.48	0.054

Dolphin V2整合包使用说明

首先将网盘内的软件压缩包下载到本地电脑上解压，然后双击启动软件.bat，等自动打开webui操作界面。

软件操作界面主要分为三个模块，全文解析，元素解析，布局分析

软件操作区域内首先点击上传图片、pdf文档或输入文件夹路径

全文解析就是处理整个PDF文档或图片转为Markdown和JSON文件

支持批量操作，输入文件夹路径到输入框即可

元素解析就是处理单张图片，格式为jpg,jpeg,png，支持解析元素类型有表格、公式、文本、代码块，支持批量操作

布局分析就是分析文档元素布局，具体效果可进行实测查看

生成结果默认保存到gradio_results文件夹内

注意事项

本软件对显卡配置要求略高，未测试电脑最低配置，建议英伟达显卡显存6G以上用户使用

软件只支持windows10或11系统，不支持手机和mac

使用前建议先更新英伟达显卡到最新版

软件运行路径及待处理文档路径中不能有非英文字符及空格

图片PDF文档解析工具Dolphin V2整合包下载链接

此内容仅限VIP查看，请先

可通过每日签到获得积分兑换VIP

AI软件用不了？2元爽玩4090：立即体验>>

热门大语言模型API免费体验：立即获取>>

软件催更及1对1人工答疑支持： https://nuowa.net/1806

字节跳动Dolphin图片文档解析工具免安装一键启动整合包下载,PDF转JSON/Markdown软件

Dolphin V2介绍

Dolphin V2整合包使用说明

注意事项

图片PDF文档解析工具Dolphin V2整合包下载链接

相关推荐

最近更新

Claude 再放大招，Sonnet 5 来了

AutoVidDub支持分角色配音的全自动视频翻译配音加字幕工具

极速轻便声音克隆语音合成软件MOSS-TTS-Nano整合包，CPU可流畅运行

最强分说话人语音识别工具，支持批量音视频识别转字幕，字幕翻译内容总结

最强PR中文视频自动语音识别生成字幕插件，语音识别准确率高支持多国语言

祝贺凡人修仙传2026年新年番开播同时在线人数超64万

Premiere Pro静音片段自动剪辑插件——Silence Remover使用教程及下载

蛙蛙写作-能替你"打工"的AI写作平台，附邀请码：UZekHC

PDFMathTranslate + MinerU 批量PDF全文双语翻译转Markdown工具

Claude居然自称“本人”

热门文章

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏，我将有更多的动力继续提供优质内容，让我们一起创建更加美好的世界！

支付宝扫一扫

微信扫一扫