推荐 GitHub 上一个基于...

  • GitHubDaily
  • 2024-11-08 13:37:16
推荐 GitHub 上一个基于 FastAPI 的 PDF 文档提取和解析工具:pdf-extract-api。

使用最新的 OCR 技术和 Ollama 模型进行处理,可将任何图像或 PDF 文件转换为 Markdown 文本或结构化的 JSON 文档。

GitHub:github.com/CatchTheTornado/pdf-extract-api

支持处理表格数据、数字或数学公式等格式,并使用 Redis 存储和缓存 OCR 结果,以提高效率。

#AI创造营#
推荐 GitHub 上一个基于...