返回技能中心
表格提取器

表格提取器

@lijie420461340
developmentPDF Table ExtractioncamelotData Parsing

使用camelot库从PDF文档中精确提取表格。处理复杂表格,包括合并单元格、无边框表格和多页布局,具有高精度。支持lattice(有边框)和stream(无边框)两种提取方法,提供高级配置选项。

🚀 使用业界领先的 camelot 工具从 PDF 文档中精确提取表格。处理复杂布局,包括合并单元格、无边框表格和多页文档。只需上传 PDF 并指定页码,表格即刻转换为清晰可用的数据格式。

💡 适用于财务报告、研究论文、数据分析和文档处理工作流。使用 lattice 方法提取有边框表格,或使用 stream 方法提取无边框表格。当您需要将静态 PDF 数据转换为可操作的电子表格或数据库时理想。

✨ 支持高级自定义,如表格区域指定、列检测和文本对齐选项。即使从格式不规范的 PDF 中也能获得高精度结果,节省数小时的手动数据输入。

GitHub

要求

camelot-py

PDF表格提取库 - 从PDF文档提取表格的行业标准

pandas

用于处理提取的表格数据的数据操作和分析库

表格提取器 - PDF表格提取工具 | OpenClaw Skills | Openclawd hub