来源:互联网 更新时间:2026-06-19 13:19
比闹钟还准。
端午节前夕,DeepSeek 果然又有新动作——官方平台全量推送了识图模式,手机端 App 也同步更新,打开就能看见入口。

其实之前已经有不少网友体验过这个功能,但当时还处于小范围灰度测试阶段,只有部分用户能在官方 App 或网页版里看到。今天下午,很多人都反馈说自己也能用了。
出于好奇,直接打开 App 测试了一轮。
第一个测试案例用了黄仁勋前段时间在北京小吃街喝豆汁的图片。可以看到,DeepSeek 能认出图中人物是黄仁勋,但瓶身上的“豆汁”字样被忽略了,结果错认成牛奶。人物表情的解读也不够精准。


接下来切换到深度思考模式,有意思的地方来了:虽然 DeepSeek 依然“看不清”瓶身上的“尹三豆汁”字样,但靠推理能力和世界知识,它推断出了这是“豆汁”。不过表情解读方面,深度思考也没帮上太多忙。


社交媒体上,不少网友也做了人物识别测试,效果不太理想——像何同学这些知名人物都出现了识别错误。

连梁文锋本人,DeepSeek 也没认出来。从思考过程看,它识别人物主要靠视觉线索(面部特征、发型)与公众形象对比,准确率不高也正常——毕竟像黄仁勋那样特征独特的人物是少数。

另外它的安全限制比较严格——上传了一张雷军近日的热门图,结果被告知“可能违反使用规范”。

接下来又让它辨认潦草汉字。图片中的烂字有横线干扰、笔画粘连,还掺杂了错别字干扰。

DeepSeek 7 个字认错了 4 个。
这意味着该模型在真实场景手写文本识别、领域词汇约束和语义纠错方面还有提升空间。

识别文物的能力倒是相当不错。虽然 DeepSeek 没能找到这件文物的具体出处,但成功判断出是莫卧儿帝国风格,并详细分析了工艺。

对于较难的图,比如找出下图中完全相同的袜子,DeepSeek 也没找对。(正确答案是第一行第三个和第三行第二个)

在钢琴和弦识别测试中,上传了一张钢琴弹奏实拍图,提问“弹的是什么和弦”。
钢琴黑键按“两黑 + 三黑”组规律排列,两黑键中间的白键永远是 D 音,从 D 出发可推断出相邻的 C 和 E 等音高,因此正确答案应是 ACE。
DeepSeek 判断错误。

提示词来自 X 博主 @thinkingshivers
同时对比测试了 Gemini 3.5 flash、GPT 5.5 和 Claude Sonnet 4.6——前两个没一个答对的,Claude Sonnet 4.6 直接罢工。这说明大模型在乐理推理方面还有明显的短板。

Gemini 3.5 flash 回答错误。

GPT 5.5 回答错误。

Claude Sonnet 4.6 罢工。
由于时间有限,测试无法面面俱到,有兴趣的话可以亲自上手试试。
随着这个模式全量发布,开发者们也有了新疑问:它和 DeepSeek 4.1 有没有关系?背后技术用的是不是原生多模态?多模态的 API 什么时候能上线?



这些问题出现在 DeepSeek 多模态团队研究者 Xiaokang Chen 的 X 贴文评论区,不过他并没有就此给出答案。
也许过几天,DeepSeek 会发布相关技术文档,拭目以待。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
帅到极致的网名女生霸气(精选100个)
帅气继父网名女生可爱英文(精选100个)
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
如何在夸克浏览器中开启网页视频的倍速播放功能?
韦一敏是什么梗
蒙古上单是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
抖音最火沙雕男生网名(精选100个)
作家助手如何上传自制封面 作家助手如何设置小说的封面
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc