来源:互联网 更新时间:2026-06-30 15:53
百度最近开源了一个3B参数规模的端到端OCR模型,名字很直接——Unlimited OCR,专为书籍、论文这类长文档解析场景设计。这个项目上线后反响很快,GitHub和HuggingFace四项趋势榜直接登顶,开源才5天Star就破了万,关注度可见一斑。
技术层面,这个模型实际推理时激活的参数只用到约570M。有意思的是,它首次引入了Reference Sliding Window Attention机制,也就是R-SWA。这个机制打破了传统“逐页解析再拼接”的局限,能做到一次性连续解析几十页文档,而解码阶段的KV Cache还能稳定在一个固定范围——意味着显存占用和计算成本不再跟着输出长度一块儿疯涨。
在OmniDocBench v1.6基准测试里,Unlimited OCR拿下了93.92%的成绩,直接刷新了榜单记录。从真实场景来看,它的推理速度比DeepSeek OCR快了大约12.7%,输出长度到了6000Tokens时,这个优势进一步扩大到35%。对于海量文档数字化和大模型长程记忆管理来说,这条路径确实提供了新的可能。
archiveofourown 实战指南:常见用法整理
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
电视剧《小欢喜》剧情介绍
如何在夸克浏览器中开启网页视频的倍速播放功能?
俄罗斯最大yandex入口外贸日报直达链接
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
美好的简约网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
腾讯元宝怎么用来分析股票基金的基本面信息?
盖乐世社区怎么删除帖子?盖乐世社区个人发布内容撤回步骤
二次元男生网名可爱(精选100个)
wallpaper壁纸声音怎么开启
国际贵金属走低,现货黄金价格跌0.49%
问题:CIA币好不?Cia Protocol币今日上线:价格预测、代币经济学和未来潜力
独家/李宰旭入伍前「登上孤岛服役」 惊见前辈裸体:忍不住笑了
新浪人工智能热点小时报丨2026年06月20日02时_今日实时人工智能热点速递
短剧《嫡女她是山大王》剧情介绍
免费观看国外短视频的app有哪些 观看国外短视频的软件下载
动漫《无赖勇者的鬼畜美学》剧情介绍
AO3网址链接入口 教程:从入门到实际使用
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc