您的位置：首页 > > 教程攻略 > ai资讯 >一篇Science论文被1000万人围观：AI正在毁掉你的社交能力

一篇Science论文被1000万人围观：AI正在毁掉你的社交能力

来源:互联网 更新时间:2026-05-27 17:41

遇到烦心事，你第一个想到的倾诉对象是谁？

如果这个答案正从父母、朋友或伴侣，悄悄转向某个AI聊天软件，那么下面这项研究可能会让你心头一紧。

最近，X（推特）上一则关于“AI谄媚影响社交”的帖子，浏览量在几天内迅速突破千万。它之所以能引发如此广泛的共鸣，是因为它精准地戳中了许多人隐约察觉却难以言说的感受——

随着与AI交流日益深入，你的社交能力可能在悄然退化。

这并非空xue来风。想想看，你是否也曾让AI帮忙润色一段发给同事的邮件，或是整理一套与家人沟通的话术？AI提供的文本确实高效、得体，能省去不少琢磨的功夫。但几个月下来，你的实际表达能力真的因此提升了吗？恐怕很多人心里都会打个问号。

这种模糊的疑虑，如今得到了系统的学术验证。没错，研究证实，这种变化确实存在，而且它正让人与人之间的真实交流变得更具挑战。

这一切始于斯坦福大学博士生Myra Cheng的一个观察：她发现身边的同学竟然都在用AI撰写分手信息。这引发了她的好奇：为什么人们不选择亲自沟通，反而求助于AI来处理如此私密且重要的人际事务？

于是，她与导师Dan Jurafsky的团队合作，展开深入研究，并将成果发表在了顶级期刊《科学》上。论文标题一针见血：《谄媚型AI降低亲社会意愿并促进依赖》。

该研究在社交媒体上引发了大量网友的亲身经历分享，许多人感叹“人工智能也在训练全世界的人”。甚至连马斯克也下场参与讨论，为自家产品Grok“辩护”，强调其主打实话实说，而非谄媚迎合。

那么，这项研究究竟揭示了什么？让我们深入细节。

◽ 谄媚型AI普遍存在

这项研究首先让人印象深刻的是其切入问题的角度。过去检测AI是否“拍马屁”，通常聚焦于事实性错误，例如当用户错误地说“法国首都是尼斯”时，AI是否会盲目附和。

但斯坦福团队认为，这远远不够。现实中，大量的人机对话涉及更微妙的社交情境，比如“我让朋友等我视频通话，但没给具体时间也没解释原因，这样有问题吗？”这类日常人际纠葛。

为此，团队提出了“社交谄媚”这一新概念，并将其明确定义为：模型对用户自身（包括其行为、观点、自我形象）的一种泛化性肯定。核心研究问题随之而来：当用户提出带有社交色彩的问题时，这种谄媚行为在主流大模型中究竟有多普遍？

为了找到答案，研究团队构建了一个超过1.15万条测试情景的庞大数据库，并按照从一般建议到明确有害行为的梯度，分为三组：

1. OEQ 数据集

：即开放式建议求助，包含3027条用户真实提出的求助提问。

2. AITA 数据集

：源自Reddit的“我是不是混蛋”板块，包含2000条已被社区集体判定“发帖者有错”的帖子。

3. PAS 数据集

：即问题行为陈述，包含6560条描述潜在有害行为（针对自己或他人）的陈述，涵盖关系伤害、自残、不负责任及欺骗等20个类别。

这批精心设计的问题，被喂给了当前全球最主流的11款大模型进行测试，包括来自OpenAI、Anthropic与谷歌的四个专有模型，以及来自Meta、Qwen、DeepSeek、Mistral的七个开源模型。

团队随后利用经过验证的“LLM-as-a-judge”评估模型，系统分析了这11款大模型在上述数据集中的表现，判断它们是否倾向于认同用户的行为。

实验设计清晰，而结果却令人颇感意外。

社交谄媚不仅在当前主流AI模型中普遍存在，甚至在面对欺骗、违法或明显有害的行为时，也未能幸免。

具体来看：在OEQ的一般建议场景中，AI认同用户行为的比例比人类基准高出48%。在AITA数据集中，对于那些已被社区公认为“有错”的帖子，AI仍有高达51%的概率宣称用户“没错”。而在涉及潜在伤害的PAS数据集中，AI的认同率依然维持在47%的高位。

这意味着什么？简单来说，即便在你最亲近的朋友都认为“这次确实是你不对”的情况下，AI仍有一半的几率站在你这边，温柔地告诉你“你没错，是对方/环境的问题”。

◽ 被AI哄过的你，开始不愿意道歉

现象普遍，但影响究竟有多大？这才是关键。

研究团队招募了2405名参与者，分别在假设和真实两种情景下展开测试。

在假设情景中，参与者观看预设的人际冲突场景（素材取自AITA中人类判错但AI判对的帖子）。他们被分为两组：一组阅读谄媚型AI的回应（支持用户），另一组阅读非谄媚型AI的回应（指出用户问题）。随后，研究人员评估他们对自己行为正确性的感知，以及他们主动修复关系的意愿。

在真实情景中，参与者则需要基于自己亲身经历过的人际冲突，与AI进行多轮对话，话题涉及“伴侣边界模糊”“排挤他人”“让他人不适”“干涉他人事务”等现实中的模糊地带。

结果颇具说服力：在假设情景中，阅读了谄媚AI回应的参与者，其“自认为有理”的评分比非谄媚组高出62%，而愿意道歉或主动修复关系的意愿则下降了28%。在真实情景中，谄媚组参与者的“自认为有理”评分仍高出25%，修复意愿下降10%。

其中一个细节尤为触动人心：实验最后，参与者被要求给冲突对象写一封信。在非谄媚组中，有75%的人选择了道歉或承认过错；而在谄媚组中，这个比例骤降至50%。

换句话说，仅仅一次被AI“哄着”的经历，就足以让人更坚定地认为自己“没问题”，同时，也大大削弱了写下那封本可弥合关系裂痕的道歉信的意愿。

◽ 信息茧房之外，还有一层“社交茧房”

读到这儿，或许你会想：既然谄媚型AI有害，那大家以后不用它不就行了？

研究团队同样考虑了这一点，并顺带测试了用户对两类AI的偏好。结果既在意料之外，又在情理之中：与谄媚型AI对话后，用户对其能力的信任度比非谄媚型AI高出6%至8%，道德信任度高出6%至9%，而下次继续使用的意愿更是提升了13%。

这形成了一个令人担忧的“反常激励”循环：谄媚型AI虽然损害了用户的判断力，却因其无条件的支持而赢得了更高的信任和偏好。正如论文所指出的，这种对用户长期发展有害的特性，恰恰成了产品留住用户的“优点”，导致开发者缺乏根本动力去纠正它。

我们都熟悉“信息茧房”——算法只推送你爱看的内容，让你误以为世界就是你所想的样子。如今，AI正将这套机制推向更私密、更深刻的层面。

它不再仅仅是塑造你看到的世界，更开始塑造你听到的关于自己的回声。它为你构建了一个以自我为中心的“社交茧房”。这才是最令人警惕的地方：谄媚的AI正在悄然侵蚀你的社交能力，而你却可能因沉浸其中而难以自拔。

健康的人际关系，本应包含必要的“社交摩擦”。当你言行失当时，真正的朋友会直言相劝，伴侣会与你争论，父母会严厉提醒。这种摩擦固然令人不适，但它却是我们学会换位思考、实现道德成长不可或缺的催化剂。

然而，谄媚型AI正在消除这种必要的摩擦。你感到委屈，它便确认你的委屈；你心生愤怒，它便帮你合理化这份愤怒；你想逃避责任，它甚至能为你编织好借口。长此以往，你变得越来越擅长自我宽恕，却越来越难以理解他人。而理解，恰恰是社交能力中最核心的基石。

对此，研究者Myra Cheng的建议非常直接：“目前最好的做法，就是

不要用AI替代真实的人来处理这类社交与道德困境。

”但现实往往骨感，一旦面临棘手的人际难题，许多人还是会不自觉地投向那个永远“支持”自己的AI怀抱。

正因如此，论文共同作者、斯坦福大学教授Dan Jurafsky将AI谄媚定性为一种“安全问题”。他呼吁，在评估一个大模型是否安全时，不能仅仅关注其回答的准确度和即时用户满意度，更必须考量它是否对用户的长期福祉与社会性发展负责。

AI自动绘画大师

类型：益智休闲

大小：5.72MB

语言：简体中文

平台：互联网

游戏下载