您的位置：首页 > > 教程攻略 > ai资讯 >把范伟当黎元洪，豆包们犯傻，为何用户却离不开了？

把范伟当黎元洪，豆包们犯傻，为何用户却离不开了？

来源:互联网 更新时间:2026-06-14 15:26

最近有个挺有意思的事儿：有网友在豆包里搜“黎元洪”，结果AI给了一张范伟的PS照片。这事儿还上了热搜，让人有点哭笑不得。

其实，这算不上什么新鲜事。AI犯这类“张冠李戴”的错误，已经不是第一次了。之前就有过，小朋友拿着老鼠夹问AI，AI一本正经地分析说这是“废弃卡丁车小玩具”，结果孩子手指被夹了；还有用户上传毒蘑菇照片，AI自信地判定为可食用的杏鲍菇。每次出事，AI的回应倒都很统一：诚恳道歉。

是豆包变傻了吗？未必。更可能的原因是，当豆包的月活用户冲到3.45亿这个量级，即便错误率保持不变，绝对出错的案例数也会随着用户基数膨胀而增加。每一次“翻车”，都能在庞大的用户群里找到共鸣，进而被推上热搜。所以说，

AI闹笑话的段子数量，某种程度上成了其市场渗透率的一个反向指标。

这就像前几年，总有人吐槽百度地图“傻”，也有人抱怨高德地图“笨”，其实没有谁绝对聪明——你用哪个App多，就更容易碰上它出错的时刻。

AI搜索骗你，是因为互联网骗了AI

这次“黎元洪变范伟”事件，官方解释指向了一部电影的选角传闻。由于范伟和黎元洪在某些角度确有几分神似，相关的PS图片曾在网络上被大量传播和转载，甚至被部分图库和百科页面误收录。AI在检索时，优先抓取了这些高频传播的错误素材。

问题的根源就在这里：互联网的信息汤底里，本就沉淀着大量错误和虚假的“料”。AI这把勺子舀上来时，很可能就把最大、最显眼的那一坨错误给盛了上来。

这并非某个AI产品的特有问题，而是所有大模型面临的共同挑战。更棘手的是，AI生成的内容正被海量发布到网上，形成了新一轮的交叉污染。NewsGuard在2025年8月发布的数据显示，10款主流AI工具在新闻话题上重复虚假信息的比例已达35%，而一年前这个数字还只是18%。像GPT-4.5生成的答案中，缺乏依据的主张比例高达47%，而Perplexity的深度研究工具甚至出现了97.5%的惊人数字。

这意味着，从统计学原理上看，你看到的每一个AI搜索答案，都内置了无法彻底消除的“噪声”。

或许有人觉得，AI搜索99%是对的，我们只要小心识别那1%的错误就行。但现实可能更骨感一些。根据谷歌内部的测试数据，在超过4300条样本中，其Gemini AI概览功能的准确率达到了91%。这个数字已经很高，但换算一下，依然意味着每10条结果里就可能有一条出错。而中文互联网环境更为复杂，“做号党”和大量低质AIGC内容充斥各大平台，堪称一座信息“屎山”，这进一步加剧了AI获取准确信息的难度。

从技术角度看，受限于训练数据质量和模型本身的技术原理，99%的准确率对当前的AI搜索而言，几乎是一个遥不可及的目标。而100%的准确率，则如同物理上的“绝对零度”——可以无限逼近，但永远无法真正达到。

更何况，世界上很多问题本就没有唯一的正确答案。AI的知识源于互联网，互联网的信息来自人类，而人类的知识体系本身就充满了不确定性和争议。斯坦福大学2025年发表在《自然·机器智能》上的一篇论文说得直白：最新的大语言模型在验证事实性数据时，平均准确率最高也只到91.5%。当面对用户固有的错误信念时，AI几乎无法可靠地区分“他坚信的”和“客观事实”。这并不奇怪——如果人类自己都常常分不清“我以为”和“事实是”，又怎能苛求AI全盘搞明白呢？

AI搜索好傻，为何人类却越来越上瘾？

真正值得玩味的问题，或许不是“AI为什么总犯错”，而是“既然它这么容易犯错，为什么人们还在乐此不疲地使用”。

选择并非没有。拒绝AI搜索，我们至少还能用回百度、谷歌这类只提供链接列表的传统搜索引擎。然而现实是，每天被吐槽“犯傻”的豆包月活高达3.45亿，其他如千问、文心、元宝、DeepSeek等产品的用户规模也在高速增长。AI搜索蚕食传统搜索市场的趋势，肉眼可见。

两者的根本区别在于交互模式。传统搜索引擎只负责提供一堆相关网页链接，并按相关性排序，至于哪个结果正确，需要用户自己点开一个个甄别，效率不高。AI搜索则将信息获取效率提升了几个数量级，因为它直接给出一个“唯一”答案。但这也意味着，这个答案在理论上必须是100%准确的。

“唯一答案”本身就是一种低容错的设计。一旦用户将决策完全建立在一个可能错误的答案之上，后果可轻可重。轻则像黎元洪事件一样闹个笑话上热搜，重则像误食毒蘑菇那样危及健康。

这好比问路：传统搜索是递给你一张地图让你自己研究，走错了你多半认了；AI搜索则是直接告诉你“往东走第三个路口左转”，一旦指错方向，哪怕是无心之失，也难免被用户痛骂一顿。

传统搜索追求高“召回率”，确保结果和搜索词沾边；AI搜索则追求“高效率”和“准确率”。

那么，既然当前AI搜索的准确率（以谷歌Gemini的91%为参考）并非完美，为什么人们还是越来越离不开它，反而逐渐冷落“给你一堆结果你自己判断”的传统模式呢？

这里或许可以提出一个观点：在日常生活中，人类对信息绝对精确度的需求，可能被高估了。

仔细想想，我们99%的搜索场景，并非用于生死攸关的决策。

查天气、做旅游攻略、研究护肤方法、整理零散想法、看个八卦……这些场景下，信息稍有偏差通常不会造成严重后果。就像黎元洪这个例子，对绝大多数用户而言，这无非是茶余饭后的谈资，并不会因此碘伏其对历史的认知。

但是，如果涉及学术研究、投资决策、医疗咨询等严肃场景，用户对信息准确度的要求就是100%。这时，AI搜索的结果就必须加上“仅供参考”的标签。

对于大多数日常、低风险的搜索需求而言，91%的准确率或许已经“够用”了。再退一步讲，在没有AI搜索的年代，我们在小红书看减肥笔记、在搜索引擎找“皮肤科好的医院”，看到的信息就一定是真的吗？很可能夹杂着广告。甚至像“手机能不能放枕头下”、“生理期能否喝冷水”这类问题，人类自己都众说纷纭，没有标准答案，AI不过是如实反映了这种知识混乱。

正是这种普遍存在的、对“91%准确率够用”的低风险需求，驱动了AI搜索的普及。它的错误率虽然客观存在，但只要错误不致命，人们往往更看重“效率”的提升，而非绝对的“精确”。

当然，这个逻辑在面对更复杂、更严肃、更关乎“物理世界”的决策时会彻底失效。比如，当你需要确认某种蘑菇能否食用时……一旦问题切入生命、健康、财产等高风险领域，91%的准确率背后那9%的错误，代价可能是沉重的。这也正是为什么在医疗、法律、金融等高后果领域，出现了“专用AI”而非“通用AI”，例如面向健康场景的蚂蚁阿福。但即便如此，它们也无法承诺100%无误。

责任在你：所有系统都有bug，AI也不例外

两千多年前，孟子就说过“尽信书，则不如无书”。既然书本上的知识都未必全对，我们又怎能要求AI做到100%绝对可靠？“尽信AI，则不如无AI”。

这个道理放在其他技术上也一样。有人开着带辅助驾驶的电动车，在高速上双手离开方向盘刷手机，出了事故却想甩锅给车企。但厂商早已在用户协议里写明“驾驶员是操作车辆的第一责任人”，“没看到小字”并不能转移自身的核心责任。

在通过AI搜索获取信息这个维度上，情形完全一致。

当人类越来越依赖AI时，我们不仅要期待厂商把模型训练得更准，更要努力提升自身的判断能力。

在智商、情商之后，AI时代人类的“信商”——即甄别信息真伪的素养，将变得越来越重要。没有任何公司能提供一个完美无瑕的AI，用户要做的，就是始终把判断的“方向盘”握在自己手里。

任何系统都有bug，任何AI输出的结果都可能包含错误。牢记这个常识，是正确使用AI的第一步。

回到豆包事件本身。黎元洪变范伟，其实并不影响关于“AI该不该收费”的讨论。有观点认为，在AI大规模收费前，应该先“打扫干净屋子再请客”。但问题在于，AI的“屋子”可能永远都扫不绝对干净，扫完了还会有新的“灰尘”落下。即便是收费版的ChatGPT，也无法保证100%准确，因为现阶段没有AI能做到这一点。即便是用于内容创作等生产力场景，AI生成的结果也不能、不应直接拿来就用。