返回技能中心
LLMWhisperer

LLMWhisperer

@gumadeiras
developmentOCRText ExtractionDocument Processing

使用 LLMWhisperer API 从图像和 PDF 中提取文本,具有先进的 OCR 功能,特别优化了手写体和复杂表单识别。

🚀 LLMWhisperer 能够从图像和 PDF 中精确提取文本,轻松处理手写内容和复杂表单。只需运行 llmwhisperer <file> 即可将视觉内容转换为可编辑的文本,快速数字化文档。

💡 适用于处理发票、收据、手写笔记、表单和扫描文件。提取的文本可保存为文件或直接输入其他工具。免费版每天支持 100 页——足以满足大多数个人和小型企业需求。

✨ 与基础 OCR 不同,LLMWhisperer 保留文档布局,并能智能处理草体书写和多栏格式等复杂内容。

GitHub

要求

LLMWHISPERER_API_KEY

来自 Unstract LLMWhisperer 服务的 API 密钥(免费层:每天 100 页)