关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01106人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

营收增长近两成,恒鑫生活何以逆势增长?

野马财经 浏览 149 08-30

开拓者高管:杨瀚森将带来很大帮助 这可能比多数人预期的都要快

直播吧 浏览 3814 07-25

创个人夏联篮板新高,中国香港球员戴维-穆奥卡拿到6分10板2帽

懂球帝 浏览 6415 07-19

王梦迪团队「自我进化agent」综述:从静态LLM到超级智能ASI

学术头条 浏览 1502 08-09

樊少皇也沦落到拍网大,票房惨不忍睹,时代想抛弃谁招呼都不会打

最爱酷影视 浏览 147 09-02

机智谈|熊友军:具身天工从能跑到好用,世界人形机器人运动会对机器人产业推动很大

贝壳财经 浏览 6555 08-18

出海成基金重仓依据!公募挖掘业绩增长“第二曲线”

券商中国 浏览 138 09-02

利空突袭!暴跌50%!

券商中国 浏览 88 01-02

为什么说本田这个“内燃机之王”,在国内被严重低估了

少数派报告Report 浏览 88 12-15

天空体育:米兰未能说服霍伊伦接受他们提供的转会条件

懂球帝 浏览 5018 08-21

单电机200kW 奔驰纯电长轴距CLA申报信息曝光

网易汽车 浏览 9790 06-24

印度在半导体领域一度领先中韩,直到美国放了一把大火

观察者网 浏览 179 08-25

叙利亚过渡政府宣布延长停火15天

上观新闻 浏览 74 01-25

特朗普:伊朗要么和平要么悲剧

CCTV国际时讯 浏览 6296 06-23

落后19分!62岁穆帅炮轰:7年前英超冠军应该是曼联 曼城需被扣分

风过乡 浏览 5247 07-23

埃里克:对上赛季4-3赢皇马印象最深;弗里克总会激励球队

懂球帝 浏览 86 01-09

兰德酷路泽混动版,搭3.5T V6混动

懂车之道 浏览 6426 06-23

高德地图宣布全面AI化 发布首个原生智能体

网易科技报道 浏览 6235 08-05

美女克拉拉官宣离婚,6年豪门婚姻告终

代军哥哥谈娱乐 浏览 110 10-18

聚酯纤维都没嫌老实人穷

老斯基财经 浏览 84 12-12

鲁政委:当前债市赎回压力几何?

首席经济学家论坛 浏览 3416 07-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3