来源:互联网 更新时间:2026-06-14 15:26
最近有个挺有意思的事儿:有网友在豆包里搜“黎元洪”,结果AI给了一张范伟的PS照片。这事儿还上了热搜,让人有点哭笑不得。

其实,这算不上什么新鲜事。AI犯这类“张冠李戴”的错误,已经不是第一次了。之前就有过,小朋友拿着老鼠夹问AI,AI一本正经地分析说这是“废弃卡丁车小玩具”,结果孩子手指被夹了;还有用户上传毒蘑菇照片,AI自信地判定为可食用的杏鲍菇。每次出事,AI的回应倒都很统一:诚恳道歉。

是豆包变傻了吗?未必。更可能的原因是,当豆包的月活用户冲到3.45亿这个量级,即便错误率保持不变,绝对出错的案例数也会随着用户基数膨胀而增加。每一次“翻车”,都能在庞大的用户群里找到共鸣,进而被推上热搜。所以说,
这次“黎元洪变范伟”事件,官方解释指向了一部电影的选角传闻。由于范伟和黎元洪在某些角度确有几分神似,相关的PS图片曾在网络上被大量传播和转载,甚至被部分图库和百科页面误收录。AI在检索时,优先抓取了这些高频传播的错误素材。
这并非某个AI产品的特有问题,而是所有大模型面临的共同挑战。更棘手的是,AI生成的内容正被海量发布到网上,形成了新一轮的交叉污染。NewsGuard在2025年8月发布的数据显示,10款主流AI工具在新闻话题上重复虚假信息的比例已达35%,而一年前这个数字还只是18%。像GPT-4.5生成的答案中,缺乏依据的主张比例高达47%,而Perplexity的深度研究工具甚至出现了97.5%的惊人数字。
或许有人觉得,AI搜索99%是对的,我们只要小心识别那1%的错误就行。但现实可能更骨感一些。根据谷歌内部的测试数据,在超过4300条样本中,其Gemini AI概览功能的准确率达到了91%。这个数字已经很高,但换算一下,依然意味着每10条结果里就可能有一条出错。而中文互联网环境更为复杂,“做号党”和大量低质AIGC内容充斥各大平台,堪称一座信息“屎山”,这进一步加剧了AI获取准确信息的难度。
更何况,世界上很多问题本就没有唯一的正确答案。AI的知识源于互联网,互联网的信息来自人类,而人类的知识体系本身就充满了不确定性和争议。斯坦福大学2025年发表在《自然·机器智能》上的一篇论文说得直白:最新的大语言模型在验证事实性数据时,平均准确率最高也只到91.5%。当面对用户固有的错误信念时,AI几乎无法可靠地区分“他坚信的”和“客观事实”。这并不奇怪——如果人类自己都常常分不清“我以为”和“事实是”,又怎能苛求AI全盘搞明白呢?
真正值得玩味的问题,或许不是“AI为什么总犯错”,而是“既然它这么容易犯错,为什么人们还在乐此不疲地使用”。
选择并非没有。拒绝AI搜索,我们至少还能用回百度、谷歌这类只提供链接列表的传统搜索引擎。然而现实是,每天被吐槽“犯傻”的豆包月活高达3.45亿,其他如千问、文心、元宝、DeepSeek等产品的用户规模也在高速增长。AI搜索蚕食传统搜索市场的趋势,肉眼可见。
两者的根本区别在于交互模式。传统搜索引擎只负责提供一堆相关网页链接,并按相关性排序,至于哪个结果正确,需要用户自己点开一个个甄别,效率不高。AI搜索则将信息获取效率提升了几个数量级,因为它直接给出一个“唯一”答案。但这也意味着,这个答案在理论上必须是100%准确的。
“唯一答案”本身就是一种低容错的设计。一旦用户将决策完全建立在一个可能错误的答案之上,后果可轻可重。轻则像黎元洪事件一样闹个笑话上热搜,重则像误食毒蘑菇那样危及健康。
这好比问路:传统搜索是递给你一张地图让你自己研究,走错了你多半认了;AI搜索则是直接告诉你“往东走第三个路口左转”,一旦指错方向,哪怕是无心之失,也难免被用户痛骂一顿。
传统搜索追求高“召回率”,确保结果和搜索词沾边;AI搜索则追求“高效率”和“准确率”。
但是,如果涉及学术研究、投资决策、医疗咨询等严肃场景,用户对信息准确度的要求就是100%。这时,AI搜索的结果就必须加上“仅供参考”的标签。
对于大多数日常、低风险的搜索需求而言,91%的准确率或许已经“够用”了。再退一步讲,在没有AI搜索的年代,我们在小红书看减肥笔记、在搜索引擎找“皮肤科好的医院”,看到的信息就一定是真的吗?很可能夹杂着广告。甚至像“手机能不能放枕头下”、“生理期能否喝冷水”这类问题,人类自己都众说纷纭,没有标准答案,AI不过是如实反映了这种知识混乱。
当然,这个逻辑在面对更复杂、更严肃、更关乎“物理世界”的决策时会彻底失效。比如,当你需要确认某种蘑菇能否食用时……一旦问题切入生命、健康、财产等高风险领域,91%的准确率背后那9%的错误,代价可能是沉重的。这也正是为什么在医疗、法律、金融等高后果领域,出现了“专用AI”而非“通用AI”,例如面向健康场景的蚂蚁阿福。但即便如此,它们也无法承诺100%无误。
两千多年前,孟子就说过“尽信书,则不如无书”。既然书本上的知识都未必全对,我们又怎能要求AI做到100%绝对可靠?“尽信AI,则不如无AI”。
这个道理放在其他技术上也一样。有人开着带辅助驾驶的电动车,在高速上双手离开方向盘刷手机,出了事故却想甩锅给车企。但厂商早已在用户协议里写明“驾驶员是操作车辆的第一责任人”,“没看到小字”并不能转移自身的核心责任。
在通过AI搜索获取信息这个维度上,情形完全一致。
任何系统都有bug,任何AI输出的结果都可能包含错误。牢记这个常识,是正确使用AI的第一步。
回到豆包事件本身。黎元洪变范伟,其实并不影响关于“AI该不该收费”的讨论。有观点认为,在AI大规模收费前,应该先“打扫干净屋子再请客”。但问题在于,AI的“屋子”可能永远都扫不绝对干净,扫完了还会有新的“灰尘”落下。即便是收费版的ChatGPT,也无法保证100%准确,因为现阶段没有AI能做到这一点。即便是用于内容创作等生产力场景,AI生成的结果也不能、不应直接拿来就用。
所以,结论很简单:下次如果真因为误信AI搜索结果而吃了毒蘑菇,可千万别只怪豆包。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
帅气继父网名女生可爱英文(精选100个)
帅到极致的网名女生霸气(精选100个)
蒙古上单是什么梗
韩漫小少爷网名大全女生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
韦一敏是什么梗
网络热词聊污是什么意思
作家助手如何上传自制封面 作家助手如何设置小说的封面
抖音最火沙雕男生网名(精选100个)
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
如何在夸克浏览器中开启网页视频的倍速播放功能?
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
有寓意的易经网名男生(精选100个)
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc