来源:互联网 更新时间:2026-06-26 12:22
百度于 6 月 22 日开源了一款名为
在深入 Unlimited OCR 之前,我们先理解一下它所属的“端到端 OCR”是什么。
小提示: 端到端模型虽然简洁,但在处理多页长文档时,每生成一个 token 都会扩大 KV cache(键值缓存),导致显存占用和延迟不断上升,用户就会感觉“AI 越解析越慢”。Unlimited OCR 正是为了解决这个问题而设计的。
Unlimited OCR 继承了
编码端采用
小提示: token 压缩就像把一本书的每一页都浓缩成一句话,AI 处理起来自然快得多。这是 Unlimited OCR 能够“越生越快”的关键技术。
Unlimited OCR 在权威评测基准上表现出色,以下是关键数据:
| 评测项目 | Unlimited OCR | DeepSeek OCR | DeepSeek OCR 2 |
|---|---|---|---|
OmniDocBench v1.5 整体得分 |
93.23 | 87.01 | 89.17 |
| 文本编辑距离 | 0.038 | — | — |
| 公式 CDM | 92.61 | — | — |
| 表格 TEDS | 90.93 | — | — |
| 读序编辑距离 | 0.045 | — | — |
OmniDocBench v1.6 整体得分 |
93.92 | — | — |
小提示: 文本编辑距离越低越好(0.038 表示错误极少),公式 CDM 和表格 TEDS 越高越好,说明公式和表格的识别准确率极高。
普通 OCR 通常采用两阶段流程(检测→识别),Unlimited OCR 是端到端模型,直接从图像到文本。更重要的是,它通过 token 压缩和 MoE 机制解决了长文档解析时越生成越慢的问题。
非常适合需要解析
模型已在 GitHub 开源(项目名 Unlimited OCR Works,目前已获 6.8K Star)。你可以从官方仓库下载预训练权重,或通过 Hugging Face 等平台调用。建议使用 8×16 A800 级别 GPU 进行训练或微调。
推理时仅激活 5 亿参数,显存占用较低。通常单张 A100 或 RTX 4090 就能流畅运行单页/少量多页文档。训练则需要多卡环境(如 8×16 A800)。
Unlimited OCR 不仅延续了 DeepSeek OCR 的优秀基因,更通过 token 压缩、MoE 解码器 等创新设计,真正实现了“越生越快”的愿景。在 OmniDocBench 评测中全面超越前代模型,尤其适合企业级长文档解析需求。如果你是开发者或研究者,不妨在 GitHub 上体验一下,或许能成为你文档处理流水线的核心组件。

Unlimited OCR Works Welcome the Era of One-shot Long-horizon Parsing
Unlimited OCR Works 的 GitHub 页面(已获 6.8K Star)
archiveofourown 实战指南:常见用法整理
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
电视剧《小欢喜》剧情介绍
如何在夸克浏览器中开启网页视频的倍速播放功能?
作家助手如何上传自制封面 作家助手如何设置小说的封面
美好的简约网名男生(精选100个)
植物娘大战僵尸电脑端与手机端存档转移的方法
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
腾讯元宝怎么用来分析股票基金的基本面信息?
wallpaper壁纸声音怎么开启
独家/李宰旭入伍前「登上孤岛服役」 惊见前辈裸体:忍不住笑了
国际贵金属走低,现货黄金价格跌0.49%
《金铲铲之战》高校赛夏季赛总决赛观赛指南来袭 还有铲铲教学一同献上
动漫《情色漫画老师OVA》剧情介绍
盖乐世社区怎么删除帖子?盖乐世社区个人发布内容撤回步骤
看韩漫的APP推荐 2026免费韩漫阅读软件大全
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc