来源:互联网 更新时间:2026-06-02 20:17
顶尖的人工智能,不仅要能解析屏幕上跳动的现代代码,更需要读懂三千年前龟甲兽骨上的刻痕。近日,腾讯混元大模型、SSV数字文化实验室联合多所高校与故宫博物院,共同发布了“Chronicles-OCR”。这是业界首个完整覆盖汉字“七体之变”演化轨迹的中国古文字感知评测基准。

为了真实、客观地衡量大模型的识别能力,该数据集由领域专家进行了多层级交叉标注,最终包含了2800张严格平衡的高质量图像。在标注策略上,团队也做了针对性区分:对于甲骨文、金文、篆书等古早字体,采用了单字级的精细标注;而对于隶书、楷书、行书、草书等更为成熟的字体,则采用了保留原始阅读顺序的序列级转写。
基于这一基准,项目团队设计了四个层层递进的核心评测任务,其核心思路在于严格将模型的“视觉感知”能力与“语义推理”能力解耦开来。随后,他们对包括GPT-5、Gemini 3.1 Pro、Claude Opus 4.7在内的28个主流多模态大语言模型进行了系统性评测,结果却出人意料。
当面对缺乏现代版式先验知识的古早字体时,主流大模型在端到端的文本检测任务中几乎全部失效。即便是在细粒度识别任务上,最高准确率也仅有27.1%。一个更有趣的发现是,在此类任务中,如果强行开启大模型的“推理”模式,非但无法帮助理解,反而会放大视觉感知阶段的不确定性,导致整体识别表现进一步下降。
评测还暴露了当前视觉大模型的另一个认知偏差:在进行字体分类时,模型更容易被载体的纹理、材质等宏观特征所吸引,而非专注于判别微观的笔画结构与风格差异。这揭示了一个关键问题——今天最顶尖的AI,在面对承载数千年文明的中国传统古文字时,距离真正的“读懂”还有很长的路要走。
汉字从殷墟甲骨一路演化至今,其形体之变,本身就是一部可视化的文明史。Chronicles-OCR基准的开源,正是直面了这一技术现实。它通过清晰可见的性能差距,为未来的视觉大模型指明了一个明确的进化方向:从简单的“识字”,走向深度的“读史”。
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
免费影视剧APP推荐
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
好用的手环阅读app下载安装
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
人声接近真人!OpenAI一口气更新三款超强语音AI
短视频软件推荐
短剧《情绪超市》剧情介绍
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
免费看电影的软件推荐
售价约3200元!暴力熊推出预开盖版Ultra 7 270K Plus:支持直触芯片散热方案
《梦幻西游》出道人金价走势解析-云游道人影响解析
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc