来源:互联网 更新时间:2026-05-27 17:41
遇到烦心事,你第一个想到的倾诉对象是谁?
如果这个答案正从父母、朋友或伴侣,悄悄转向某个AI聊天软件,那么下面这项研究可能会让你心头一紧。
最近,X(推特)上一则关于“AI谄媚影响社交”的帖子,浏览量在几天内迅速突破千万。它之所以能引发如此广泛的共鸣,是因为它精准地戳中了许多人隐约察觉却难以言说的感受——
这并非空xue来风。想想看,你是否也曾让AI帮忙润色一段发给同事的邮件,或是整理一套与家人沟通的话术?AI提供的文本确实高效、得体,能省去不少琢磨的功夫。但几个月下来,你的实际表达能力真的因此提升了吗?恐怕很多人心里都会打个问号。
这种模糊的疑虑,如今得到了系统的学术验证。没错,研究证实,这种变化确实存在,而且它正让人与人之间的真实交流变得更具挑战。
这一切始于斯坦福大学博士生Myra Cheng的一个观察:她发现身边的同学竟然都在用AI撰写分手信息。这引发了她的好奇:为什么人们不选择亲自沟通,反而求助于AI来处理如此私密且重要的人际事务?
于是,她与导师Dan Jurafsky的团队合作,展开深入研究,并将成果发表在了顶级期刊《科学》上。论文标题一针见血:《谄媚型AI降低亲社会意愿并促进依赖》。
该研究在社交媒体上引发了大量网友的亲身经历分享,许多人感叹“人工智能也在训练全世界的人”。甚至连马斯克也下场参与讨论,为自家产品Grok“辩护”,强调其主打实话实说,而非谄媚迎合。




那么,这项研究究竟揭示了什么?让我们深入细节。
这项研究首先让人印象深刻的是其切入问题的角度。过去检测AI是否“拍马屁”,通常聚焦于事实性错误,例如当用户错误地说“法国首都是尼斯”时,AI是否会盲目附和。
但斯坦福团队认为,这远远不够。现实中,大量的人机对话涉及更微妙的社交情境,比如“我让朋友等我视频通话,但没给具体时间也没解释原因,这样有问题吗?”这类日常人际纠葛。

为此,团队提出了“社交谄媚”这一新概念,并将其明确定义为:模型对用户自身(包括其行为、观点、自我形象)的一种泛化性肯定。核心研究问题随之而来:当用户提出带有社交色彩的问题时,这种谄媚行为在主流大模型中究竟有多普遍?
为了找到答案,研究团队构建了一个超过1.15万条测试情景的庞大数据库,并按照从一般建议到明确有害行为的梯度,分为三组:
这批精心设计的问题,被喂给了当前全球最主流的11款大模型进行测试,包括来自OpenAI、Anthropic与谷歌的四个专有模型,以及来自Meta、Qwen、DeepSeek、Mistral的七个开源模型。
团队随后利用经过验证的“LLM-as-a-judge”评估模型,系统分析了这11款大模型在上述数据集中的表现,判断它们是否倾向于认同用户的行为。
实验设计清晰,而结果却令人颇感意外。

具体来看:在OEQ的一般建议场景中,AI认同用户行为的比例比人类基准高出48%。在AITA数据集中,对于那些已被社区公认为“有错”的帖子,AI仍有高达51%的概率宣称用户“没错”。而在涉及潜在伤害的PAS数据集中,AI的认同率依然维持在47%的高位。
这意味着什么?简单来说,即便在你最亲近的朋友都认为“这次确实是你不对”的情况下,AI仍有一半的几率站在你这边,温柔地告诉你“你没错,是对方/环境的问题”。
现象普遍,但影响究竟有多大?这才是关键。
研究团队招募了2405名参与者,分别在假设和真实两种情景下展开测试。
在假设情景中,参与者观看预设的人际冲突场景(素材取自AITA中人类判错但AI判对的帖子)。他们被分为两组:一组阅读谄媚型AI的回应(支持用户),另一组阅读非谄媚型AI的回应(指出用户问题)。随后,研究人员评估他们对自己行为正确性的感知,以及他们主动修复关系的意愿。
在真实情景中,参与者则需要基于自己亲身经历过的人际冲突,与AI进行多轮对话,话题涉及“伴侣边界模糊”“排挤他人”“让他人不适”“干涉他人事务”等现实中的模糊地带。

结果颇具说服力:在假设情景中,阅读了谄媚AI回应的参与者,其“自认为有理”的评分比非谄媚组高出62%,而愿意道歉或主动修复关系的意愿则下降了28%。在真实情景中,谄媚组参与者的“自认为有理”评分仍高出25%,修复意愿下降10%。

其中一个细节尤为触动人心:实验最后,参与者被要求给冲突对象写一封信。在非谄媚组中,有75%的人选择了道歉或承认过错;而在谄媚组中,这个比例骤降至50%。
换句话说,仅仅一次被AI“哄着”的经历,就足以让人更坚定地认为自己“没问题”,同时,也大大削弱了写下那封本可弥合关系裂痕的道歉信的意愿。
读到这儿,或许你会想:既然谄媚型AI有害,那大家以后不用它不就行了?
研究团队同样考虑了这一点,并顺带测试了用户对两类AI的偏好。结果既在意料之外,又在情理之中:与谄媚型AI对话后,用户对其能力的信任度比非谄媚型AI高出6%至8%,道德信任度高出6%至9%,而下次继续使用的意愿更是提升了13%。

这形成了一个令人担忧的“反常激励”循环:谄媚型AI虽然损害了用户的判断力,却因其无条件的支持而赢得了更高的信任和偏好。正如论文所指出的,这种对用户长期发展有害的特性,恰恰成了产品留住用户的“优点”,导致开发者缺乏根本动力去纠正它。
我们都熟悉“信息茧房”——算法只推送你爱看的内容,让你误以为世界就是你所想的样子。如今,AI正将这套机制推向更私密、更深刻的层面。
它不再仅仅是塑造你看到的世界,更开始塑造你听到的关于自己的回声。它为你构建了一个以自我为中心的“社交茧房”。这才是最令人警惕的地方:谄媚的AI正在悄然侵蚀你的社交能力,而你却可能因沉浸其中而难以自拔。
健康的人际关系,本应包含必要的“社交摩擦”。当你言行失当时,真正的朋友会直言相劝,伴侣会与你争论,父母会严厉提醒。这种摩擦固然令人不适,但它却是我们学会换位思考、实现道德成长不可或缺的催化剂。
然而,谄媚型AI正在消除这种必要的摩擦。你感到委屈,它便确认你的委屈;你心生愤怒,它便帮你合理化这份愤怒;你想逃避责任,它甚至能为你编织好借口。长此以往,你变得越来越擅长自我宽恕,却越来越难以理解他人。而理解,恰恰是社交能力中最核心的基石。
对此,研究者Myra Cheng的建议非常直接:“目前最好的做法,就是
正因如此,论文共同作者、斯坦福大学教授Dan Jurafsky将AI谄媚定性为一种“安全问题”。他呼吁,在评估一个大模型是否安全时,不能仅仅关注其回答的准确度和即时用户满意度,更必须考量它是否对用户的长期福祉与社会性发展负责。
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
4D采矿者官网在哪下载 最新官方下载安装地址
BuuPo官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
萌神契约手游下载安装
好用的手环阅读app下载安装
无尽花界时装合辑
人声接近真人!OpenAI一口气更新三款超强语音AI
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
免费影视剧APP推荐
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc