之前和大家分享了两个热门的PDF转Markdown软件MinerU和Marker,这两个应用都是本地离线应用,整个处理过程完全依赖于本地电脑,如果PDF文档内容比较复杂或是文件比较大的话,电脑配置较低的用户用起来就比较麻烦,比如处理时间过长或是显存报错等。本次再和大家分享另一个热门的PDF转Markdown应用Zerox,这个应用可以使用在线大语言模型来识别转换PDF文档内容。借助最新强大的在线大语言模型利用云端处理能力解决了本地电脑配置不足的问题。原项目地址:https://github.com/getomni-ai/zerox,我制作了最新版一键启动整合包,操作界面如下:

首先到我网盘内将程序压缩包下载到本地电脑解压,然后双击start.exe即可启动软件。
将需要处理的PDF文件拖到软件窗口里,软件会识别PDF文件路径地址,自动填充到待处理PDF文档输入框内。
大语言模型可选择OpenAI的ChatGPT和Google的Gemini。由于Zerox需要大语言模型的多模态能力,即图片理解能力,所以ChatGPT的3.5免费版是不支持的,你需要使用付费版GPT-4系列模型,如GPT-4o,你也也可以使用其它模型,直接在文本框里手动输入模型名即可。你也可以使用Google的Gemini模型,关于免费申请Google Gemini API可以看我另外一篇文章《免费申请Google Gemini API密钥教程》。列表里预设了Gemini 1.5系列3个模型,Gemini 1.5 Pro最新最强大。Gemini 1.5 Flash速度最快,Gemini 1.5 Flash-8B最小的模型。
API KEY为你申请到的大语言模型的API KEY,通过API使用必须要有的API KEY,在这里输入
OpenAI base_url为OpenAI 的API调用地址,如果你用的是官方的API,这里可以不用填。如果你用的是在国内购买的ChatGPT API,这里需要填写转发地址。
处理页数就是想要处理这个PDF文档的第几页,直接输入页码数字,数字之间用英文”,”隔开,如1,3,5。留空表示处理整个PDF文档内容。
然后点击按钮开始转换即可开始处理PDF文档。
如果你连续多次点击按钮处理文档,如果有报错的话,重启软件即可。
在线大语言模型版PDF转Markdown软件zerox整合包下载地址:
相关推荐
PDF/图片转markdown软件MonkeyOCR整合包,文档图片解析工具下载
微软PDF/WORD/HTML文档转Markdown格式软件markitdown整合包下载
PDF转Markdown软件MinerU 1.1.0版整合包使用说明视频教程
PDF转Markdown/JSON软件MinerU最新2.1.4版一键启动整合包下载
PDF/EPUB转Markdown/HTML软件Marker v1.6.1 2025-03-21版
最新版PDF转Markdown格式软件MinerU一键启动整合包v0.10.0下载
批量PDF文档转MD格式软件marker整合包下载,PDF文件转Markdown格式文件工具
PDF转md格式软件MinerU整合包下载,一键pdf批量转markdown免费工具
最近更新

免费在线视频去水印工具方法
本次分享一个免费的在线视频去水印工具–记灵 这个在线工具目前是完全免费的,上传mp4视频文件,然后鼠标框选去水印区域,然后点击处理等待处理完成就可以了,操作非常简单。 这个去水印工具是采用打码的方式覆盖原水印区域的,并不是AI智...

即梦AI(可灵)视频制作9种电影级运镜提示词,小白秒变大导演
视频制作方式多种多样,想做出一个观感体验极佳的精彩视频,运镜效果少不了。这里整理了9种实用的电影级运镜方式,学会这些运镜小白也可以成为大导演。你可以将这些运镜效果用在即梦或可灵AI中视频生成的时候,提供了运镜参考关键词,如果不会写关键词的,...

带声音克隆功能的对话型文字转语音软件higgs-audio免安装一键启动整合包下载
higgs-audio是本月刚发布的一款非常强大的文字转语音工具,上线不到一个月就获得了5.9K个星,可以说是非常热门的项目了。这个软件可以实现文字转语音及声音克隆功能,不过可以实现这个功能的这类软件很多,higgs-audio只是说好一点...

本地离线翻译软件LibreTranslate免安装一键启动包下载
LibreTranslate是一款热门的免费本地离线翻译软件,无需联网,方便某些电脑无法联网但需要进行翻译的场景使用。我制作了最新版免安装一键启动整合包,下载解压即用。 LibreTranslate介绍 免费开源机器翻译 API,完全自托管...

抖音出品高质量声音克隆文字转语音合成软件MegaTTS3整合包下载
MegaTTS3是抖音团队联合国内其他大学研发的一款语音合成及声音克隆应用,可实现零样本语音克隆及富有情感的自然语音合成。我基于当前最新版制作了免安装一键启动整合包。 MegaTTS3介绍 MegaTTS 3 是字节跳动(ByteDance...

副业变现项目分享20250709期

有声读物制作软件audiblez整合包下载,将epub电子书转为m4b有声书
和大家分享一个方便快捷的有声书制作软件audiblez,audiblez可以将epub格式电子书快速转为m4b有声书,支持合成中文,英语,日语等八国语言语音,本地离线操作,不依赖云端服务。我基于最新版制作了免安装一键启动整合包。 audib...

百度夸克webdav服务+alist+RaiDrive,将网盘挂载为本地电脑硬盘方法教程
由于每天都要操作网盘不下十几次,频繁启动网盘比较麻烦。 使用百度夸克网盘的webdav服务可以将百度夸克网盘挂载到本地电脑上,就像操作本地电脑硬盘一样操作网盘,非常方便。我们以alist+raidrive为例演示。 首先打开百度网盘pan....

Unreal Engine 5恐怖游戏设计制作教程,从入门到精通从零开始完整项目开发详细讲解,中英文字幕
和大家分享一个以前收集的UE5虚幻引擎恐怖游戏开发教程,这是国外一个大神制作的视频教程,教程从零开始到制作出一款完整的游戏。内容讲解全面,如蓝图基础知识讲解、角色控制、高级交互系统、高级库存系统、物品检查、恐怖环境氛围设计、过场动画、AI系...

PDF/图片转markdown软件MonkeyOCR整合包,文档图片解析工具下载
MonkeyOCR是上个月刚发布的一款文档解析工具,可以将PDF文档或图片识别转换为markdown格式文件。官方测试显示性能极佳。我基于当前最新版制作了免安装一键启动整合包,支持批量操作,并降低了显卡要求。 MonkeyOCR官方介绍 M...