推荐 GitHub 上一个基于...
- GitHubDaily
- 2024-11-08 13:37:16
推荐 GitHub 上一个基于 FastAPI 的 PDF 文档提取和解析工具:pdf-extract-api。
使用最新的 OCR 技术和 Ollama 模型进行处理,可将任何图像或 PDF 文件转换为 Markdown 文本或结构化的 JSON 文档。
GitHub:github.com/CatchTheTornado/pdf-extract-api
支持处理表格数据、数字或数学公式等格式,并使用 Redis 存储和缓存 OCR 结果,以提高效率。
#AI创造营#
使用最新的 OCR 技术和 Ollama 模型进行处理,可将任何图像或 PDF 文件转换为 Markdown 文本或结构化的 JSON 文档。
GitHub:github.com/CatchTheTornado/pdf-extract-api
支持处理表格数据、数字或数学公式等格式,并使用 Redis 存储和缓存 OCR 结果,以提高效率。
#AI创造营#