关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:01287人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日供低至23元!车市开年遇冷,车企打响“金融战”

国际金融报 浏览 83 01-28

《小城大事》主演爆雷!校园霸凌致女生精神分裂

萌神木木 浏览 108 01-11

以方袭击后 美副总统表态:加沙停火协议仍在维持

国际在线 浏览 166 10-29

孙艺珍最新生图撞脸老公玄彬,43岁显出老态,剪短发装嫩太违和

萌神木木 浏览 195 10-21

河南"妻儿三人被发小杀害案"宣判:被告人获死刑

红星新闻 浏览 125 12-24

第100台设备落地!胜科纳米与赛默飞共铸二十年“双向成就”

爱集微 浏览 414 10-29

马卡:桑托斯与内马尔将合作,制定平衡俱乐部与国家队的计划

懂球帝 浏览 119 12-24

52岁郭德纲也没想到 徒弟阎鹤祥给他争光了

乡野小珥 浏览 142 11-27

黄慧颐手撕保剑锋 曾黎意外卷入风波

第一娱记 浏览 92 01-16

上天的小鼠为何更瘦?这场跨年科学对话透露了很多航天趣事|科学家·马上回答

封面新闻 浏览 142 01-02

与抖音退货服务“分手”,1300亿王卫有何打算?

雷达财经 浏览 131 12-23

“恐龙院士”徐星:在朝阳,孩子们可以近距离与化石对话

新华社 浏览 222 10-13

特朗普公布马杜罗被捕后照片

界面新闻 浏览 110 01-04

丹麦议员:我从没想过会站在美国使馆前示威

环球网资讯 浏览 108 01-19

以军对加沙地带南部的哈马斯目标发动袭击

新华社 浏览 194 10-21

不是谁弱谁有理,何美延只是说的好听

小椰的奶奶 浏览 143 12-11

方媛全家助阵郭富城演唱会,2个女儿不停向爸爸挥手,俏皮又可爱

素素娱乐 浏览 2902 04-25

任泽平发声回应但斌“认错”:理性讨论比对错更重要

财视传播 浏览 91 01-20

6.4万的特斯拉FSD将成为历史!

新车评网 浏览 100 01-20

71岁上海爷叔网恋"小姑娘"转30万 约会遭对方持刀勒索

上观新闻 浏览 149 12-02

强过微软?谷歌Pixel 9手机新AI功能加持拍照、截图、图片生成

华尔街见闻官方 浏览 19346 07-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2