来源:互联网 更新时间:2026-06-18 15:26

就在刚刚,DeepSeek 上线了识图模式,显示正在灰测中。这意味着讨论了一整年的 DeepSeek 多模态能力,终于来了!

目前 DeepSeek 网页版和 App 更新后都有可能被灰测到识图模式,我们第一时间进行了实测。
DeepSeek 负责多模态的研究员陈小康在 X 上发文:Now, we see you,并配上了一张图。我们就让 DeepSeek 来解读一下这张图究竟意味着什么。

结果显示,它能识别出这张图背后的隐喻。虽然图中没有任何关于 DeepSeek 的字眼,但它结合对发布者身份和图像的识别,推断出这是关于 DeepSeek 多模态能力的更新。
最后给出一句十分到位的总结:

比起回答结果,我们发现 DeepSeek 识图模式的思考过程更有意思。

上下滑动查看完整思考过程
过去 AI 来看那张推特截图,大概率是老老实实描述:「两只蓝色鲸鱼,左边戴眼罩,右边没戴。」
但 DeepSeek 它上来就开始追问:这人是谁?他为什么发这个?鲸鱼 logo 代表什么?眼罩上的 XX 又在暗示什么?

这才是我们刷到一张梗图时脑子里真正发生的事。没人会先数鲸鱼有几只,我们关心的是谁在对谁说话,说的是什么潜台词。
比如它甚至一度把图中的眼罩联想到《天元突破》里卡米那的眼镜,然后自己打脸:「不,这太宅男向了。」「等等,仔细看……」 「再换个角度……」 。
前面那些推理、联想、自我纠正,都挺精彩。但整段思考过程里最反常识的部分,其实是它推理到快收尾时,突然自己喊了个暂停,给自己开了一场小型答辩会。

它列出三个问题自问自答,
就像我们平时给结论之前,脑子里也会过一遍:「等等,这个前提对吗?那个假设站得住吗?万一我理解错了方向呢?」
我们还把经典的 AI 测试题——数手指,抛给了 DeepSeek。

它思考了一通,还是回答错了,中间还吐槽了一句:「我真的是数晕了。」
不过如果我再引导一下,它还是可以回答正确。

另外一个数手指的测试中,第一次回答错误之后,我没给答案,只是让它再想想,也能给出正确的回答。


我们还试了试一个经典的「爱心」测试,这个图之前难倒了所有 AI , DeepSeek 同样没有能识别出来。

抛开这些难度较高的极限测试,初步测试下来,DeepSeek 识图的准确率其实还是比较高,不开思考模式的话甚至半秒就能给出回答。
比如这个电影剧照的识别,应该是已经在数据库内了。

对于抽象图片的理解也十分到位。

优衣库这个商品图的理解也没有问题。

不过这个识图的过程应该是没有联网搜索,只能基于知识库回答,所以一些比较新的东西,就无法识别,比如苹果这个新的吉祥物 Finder 酱。

而且识图模式上传的文件格式也有限制,比如不支持 HEIF 格式。

DeepSeek 识图模式上线,意味着这只鲸鱼终于开眼了,但也许只是刚刚开始。
DeepSeek 多模态更多的能力可能很快也会陆续更新,补上这块短板后,整个国产模型的格局可能也会再次迎来微妙的变化。
我们将持续跟大家分享 DeepSeek 识图模式更多的体验,也欢迎大家体验后与我们分享有意思的小技巧和细节。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
帅到极致的网名女生霸气(精选100个)
帅气继父网名女生可爱英文(精选100个)
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
如何在夸克浏览器中开启网页视频的倍速播放功能?
韦一敏是什么梗
蒙古上单是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
抖音最火沙雕男生网名(精选100个)
作家助手如何上传自制封面 作家助手如何设置小说的封面
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc