olmOCR,一款开源的高性能OCR模型，专门用于将PDF和文档图像转

又仁看科技 2025-02-26 09:30:46

olmOCR ,一款开源的高性能 OCR 模型，专门用于将 PDF 和文档图像转换为清晰、结构化的纯文本。模型足够小，可以在本地运行。

github.com/allenai/olmocr

基于 Qwen2-VL-7B-Instruct 构建。它通过在多样化数据集上微调，并结合高效的推理引擎，实现了低成本、高质量的文本提取。olmOCR 的优势在于其性能卓越，能够处理复杂布局的文档；成本低，处理百万 PDF 页面仅需约 190 美元；输出为 Markdown 格式，便于解析；并且完全开源，支持大规模 GPU 扩展。

0 阅读：1

又仁看科技

感谢大家的关注

作者最新文章

1

经典机器学习电子书《Approaching (Almost) Any Machi

2

月之暗面在7月份发布的的底层推理平台Mooncake的论文，刚获得了FAST

3

DeepSeek开源周第三天的项目：DeepGEMM 。又是一个针对 NVIDI

4

olmOCR ,一款开源的高性能 OCR 模型，专门用于将 PDF 和文档图像转

5

南京大学计算机科学与技术系理论组的wikitcs.nju.edu.cn/wiki

6

一份特殊的网络教程：“如果我们不使用 TCP 或 UDP 会发生什么？”gith

7

电子书《Rust算法教程 The Algos》阅读网址： algo.cours

8

HuggingFace的创始人Thomas Wolf对今天DeepSeek的开源

9

一篇介绍操作系统上下文切换的博文mohitmishra786.github.io

10

北京大学数学科学学院林作铨教授的人工智能课课件www.math.pku.edu.

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

说刘强东作秀的，你们让王兴也秀一个噻，或者你们自己做一天体验一下。一个千亿身价的

2

华为自研鸿蒙电脑，没有键盘！是一整块可折叠的超大屏幕，然后内置大面积线性马达，通

3

昨天，华为终端发布华为nova全球代言人易烊千玺手持华为nova14系列的海报

4

字节的工资是真的高啊！

5

618手机大促，不同价位手机，超值推荐！你觉得618购买手机性价比高吗？

6

京东称有外卖骑手遭遇2选1外卖“二选一”，困住的不只是骑手近日，京东发布“致全体

7

格力电器董明珠董事长的“海归论”，遭到一些人的批评和质疑，个人觉得大可不必。

8

OPPO发布会现场放大招OPPOReno14系列来了，快速过一下产品力。外观主

9

网传华为nova14部分规格曝光：全系内存12GB，超大杯麒麟9系芯片+红枫多光

10

左边是Vivo拍的，右边是OPPO拍的，大家觉得哪个好看？

科技最新文章

1

这个牛，屏显手机壳，NFC供电，随时换照片手机壳。华为nova14及鸿蒙电脑发布

2

华为发布会华为nova14Ultra产品力好强，三颗镜头都是RYYB

3

小米玄戒O1的GeekBench跑分已经被陆续披露：单核：3119多核：9673

4

偏偏不看好你，偏偏小米最争气，小米玄戒O1碾压A18Pro。最新泄露的Geek

5

OPPOReno14、vivoS30、荣耀400怎么选？看来5月份不少厂商

6

估计今晚好多华人该睡不着了！今晚全球科技圈彻底不淡定了！谁能想到，华为昇腾芯片

7

荣耀400即将发布荣耀300价格跳水，最高降价至千元！随着荣耀400系列即将发

8

vivoS30小屏新机：能否力压X200mini成真香之选？不少人在讨论

9

6.5寸的屏幕塞进了7200mh高硅超大电池，这次不仅听劝给你金属边框，还把金属

10

618手机大促，不同价位手机，超值推荐！你觉得618购买手机性价比高吗？