返回技能中心
MinerU PDF 解析器

MinerU PDF 解析器

@kesslerio
developmentPDF parsingdocument extractionlocal processing

一个 Clawdbot 技能,使用 MinerU 在本地进行 PDF 解析,支持 CPU 处理。生成丰富的结构化输出,包括 Markdown、带布局数据的 JSON 和提取的图像,无需 GPU 资源。

🚀 使用 MinerU PDF 解析器轻松从 PDF 中提取结构化数据。这个 Clawdbot 技能在本地 CPU 上运行——无需 GPU——将 PDF 转换为丰富的 Markdown、详细的 JSON 布局数据和提取的图像。完美用于自动化文档处理工作流。

💡 适合需要精确文本提取、布局保留和从复杂 PDF 恢复图像的项目。无论您是在构建文档分析工具、数据管道还是内容管理系统,此技能都能处理表格、多页文档并保持结构完整性。

✨ 完全可配置,支持灵活的语言选择、线程选项和自定义输出格式。在本地处理文档以获得隐私和速度,无需外部 API 依赖。

GitHub

要求

MinerU

用于 PDF 解析和提取的 MinerU 命令行工具

Clawdbot

用于技能集成的 Clawdbot 框架