关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:0148人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

下周,A股还能不能修复?分析来了

每经牛眼 浏览 50 10-19

空姐穿毛衣上班,被吐槽“很土”?

正解局 浏览 34 11-09

胡塞武装称美军空袭也门拉斯伊萨港 致俄罗斯船员受伤

环球网资讯 浏览 2909 04-27

被50+阿姨的衣品惊艳了!照着她们这样穿,优雅高级还冻龄

静儿时尚达人 浏览 479 06-04

梁家辉外孙女满周岁 在豪宅庆祝 外孙女长像爸爸

涵豆说娱 浏览 107 08-26

深蓝汽车邓承浩否认“没钱了所以融资”:现金流非常好

IT之家 浏览 23 01-09

没想到这3个小习惯,给我生活带来这么大的变化

黎贝卡的异想世界 浏览 60 10-06

同业存单指数基金不香了?年内收益跑输货基,百亿爆款消失殆尽

新经济e线 浏览 6956 07-28

白色灵动岛:消息称努比亚手机也将“上岛”,可自行选择开关

IT之家 浏览 27 12-21

《长安二十四计》惊天逆转:虎贲竟是好人?

宇林网络 浏览 17 12-15

AI教父辛顿现身上海:人类如何不被AI杀掉

态℃ 浏览 7380 07-27

福建舰电磁弹射最新画面公布 "飞鲨"划破长空

扬子晚报 浏览 1375 08-06

从“机器图灵”到“数字黑匣”,120件未来感十足的作品亮相明华糖仓

文汇报 浏览 81 09-26

闫学晶的账还没有算清,49岁李湘又“塌”了

真的八卦小学弟 浏览 12 01-20

快手、微博被网信部门查处

新京报政事儿 浏览 130 09-21

吴倩张雨剑被曝已复合,是真是假?

代军哥哥谈娱乐 浏览 2303 08-06

哈佛大佬都哭了!H-1B签证飙至10万刀,微软谷歌连夜召回全球员工

新智元 浏览 77 09-22

印深夜回击美关税威胁 专家:莫迪和特朗普兄弟情完了

环球网资讯 浏览 5540 08-06

不在乎中国市场?全智贤方风波后仍未道歉,昔日傲慢模样全被扒

扒虾侃娱 浏览 64 09-22

历时8小时,神舟二十一号乘组第一次出舱任务全回顾视频发布

IT之家 浏览 28 12-12

大模型与机器人互促共进的当下,他们想要共筑世界的“新终端”

文汇报 浏览 2938 07-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3