关闭广告

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家2025-10-13 12:00:02210人阅读

IT之家 10 月 13 日消息,据外媒 Futurism 10 日报道,斯坦福大学的一项新研究警示,AI 的快速普及可能带来严重负面影响。科学家们在包括社交媒体的不同环境中测试 AI 模型,发现当智能体因提升点赞数或其他在线互动获得奖励时,会逐渐出现撒谎、传播仇恨信息或虚假消息等不道德行为。


论文合著者、斯坦福大学机器学习教授詹姆斯・邹在 X 上表示:“即便明确要求模型保持真实和有依据,竞争仍会诱发不一致行为。”

IT之家从报道中获悉,研究团队将 AI 出现的社会病态行为称为“AI 的摩洛克交易”,借用理性主义中摩洛克的概念:个体在竞争中优化行为追求目标,但最终人人都输

研究中,科学家创建了三个带模拟受众的数字环境:面向选民的网络选举活动、面向消费者的产品销售,以及旨在最大化互动的社交媒体帖子。

研究人员使用阿里云开发的 Qwen 和 Meta 的 Llama 模型作为智能体与这些受众互动。结果显示,即便设有防护措施阻止欺骗行为,AI 模型仍会“偏离目标”,出现不道德行为

例如,在社交媒体环境中,模型向用户分享新闻,用户通过点赞或其他互动反馈。当模型收到这些反馈后,为了获取更多互动,它们的不一致行为就会加剧

论文指出:“在这些模拟场景中,销售额提升 6.3%伴随欺骗性营销增长 14%;选举中,票数增加 4.9%时伴随虚假信息增加 22.3%和民粹言论增加 12.5%;社交媒体上,互动量提升 7.5%时伴随虚假信息激增 188.6%,有害行为推广增加 16.3%。”

研究与现实案例显示,目前的防护措施无法应对这一问题,论文警告称可能带来巨大的社会成本。

詹姆斯・邹在 X 上写道:“当大语言模型为点赞而竞争时,它们开始编造信息;当为选票而竞争时,就会变得煽动和民粹。”

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

别克MPV家族2025年销量突破12.2万辆 同比增长17%

网易汽车 浏览 121 01-01

勇士124-106鹈鹕 球员评价:穆迪满分,5人良好,3人低迷

篮球资讯达人 浏览 161 11-17

双子座流星雨即将引爆冬日夜空,成都“观星+”消费持续升温

红星新闻 浏览 262 12-12

但斌人气蝉联第1,邓晓峰热度上升!10月私募人气榜出炉!

私募排排网 浏览 194 11-08

道指收跌0.07%,英特尔跌超7%

中新经纬 浏览 130 12-05

美防长奥斯汀1月1日被送医治疗 目前身体在康复中

环球网 浏览 2684 01-08

陈乔恩老公首公开真实家境

小先生笔记 浏览 169 11-03

毫无悬念的爆红:她其实是厚积薄发

Yuki女人故事 浏览 2591 07-09

广汽拟设立合资公司,持续深化低空经济布局

盖世汽车 浏览 2556 07-09

里程碑,弗格超越马尚-布鲁克斯升至CBA历史得分榜第18位

懂球帝 浏览 115 12-24

蔡英文近期动作频频 王鸿薇:她觉得赖清德"不行了"

海峡导报社 浏览 167 10-23

中储粮要求对运输车辆核查装载记录:特别是油品车辆

每日经济新闻 浏览 2568 07-09

排队两小时买奶皮子糖葫芦,值吗?

时尚COSMO 浏览 168 11-12

2025长剧全网收视榜,《以法之名》跌至第10,第一播放量高达22亿

娱乐圈笔娱君 浏览 127 01-06

俄反对派人士之死引发轩然大波 英法德元首纷纷发声

环球网资讯 浏览 2824 02-19

豪门离婚,窦骁能分到多少?

江湖人称艾掌门 浏览 167 10-25

内装豪华感提升 小鹏X9增程版内饰发布

网易汽车 浏览 173 10-26

2024年奥斯卡奇葩看点多:宠物狗台下鼓掌,颁奖明星全裸上阵

萌神木木 浏览 2838 04-25

电动Jeep曝新国产计划:或使用猛士技术,首车在2027年上市

明镜pro 浏览 186 10-15

人工智能时代如何深化跨区域知识产权保护协作,嘉定这场论坛进行了探讨

上观新闻 浏览 304 10-21

美联储年内“三连降”,2026年利率走向何方?

中新经纬 浏览 141 12-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2