MinerU:专为科技文献设计的... AI小小报 2024-11-19 15:11:14 MinerU:专为科技文献设计的 PDF 转换工具MinerU 是一款专注于科技文献的工具,能够将 PDF 转化为机器可读的格式,如 markdown 和 json,便于用户抽取任意格式。该工具诞生于 InternLM 的预训练过程中,支持自动识别并转换 LaTeX 和 HTML 格式,具备自动 OCR 功能,并支持多语言。自今年7月份开源以来,MinerU 已在 GitHub 上斩获 17k Star。三花AI科技文献PDF