olmOCR:可能是目前最好的开源OCR...

  • 斌叔OKmath
  • 2025-03-05 11:56:49
olmOCR:可能是目前最好的开源OCR模型
基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。
Github:网页链接
模型:网页链接
在线使用:网页链接
olmOCR:可能是目前最好的开源OCR...