关闭广告

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家2025-10-13 12:00:02211人阅读

IT之家 10 月 13 日消息,据外媒 Futurism 10 日报道,斯坦福大学的一项新研究警示,AI 的快速普及可能带来严重负面影响。科学家们在包括社交媒体的不同环境中测试 AI 模型,发现当智能体因提升点赞数或其他在线互动获得奖励时,会逐渐出现撒谎、传播仇恨信息或虚假消息等不道德行为。


论文合著者、斯坦福大学机器学习教授詹姆斯・邹在 X 上表示:“即便明确要求模型保持真实和有依据,竞争仍会诱发不一致行为。”

IT之家从报道中获悉,研究团队将 AI 出现的社会病态行为称为“AI 的摩洛克交易”,借用理性主义中摩洛克的概念:个体在竞争中优化行为追求目标,但最终人人都输

研究中,科学家创建了三个带模拟受众的数字环境:面向选民的网络选举活动、面向消费者的产品销售,以及旨在最大化互动的社交媒体帖子。

研究人员使用阿里云开发的 Qwen 和 Meta 的 Llama 模型作为智能体与这些受众互动。结果显示,即便设有防护措施阻止欺骗行为,AI 模型仍会“偏离目标”,出现不道德行为

例如,在社交媒体环境中,模型向用户分享新闻,用户通过点赞或其他互动反馈。当模型收到这些反馈后,为了获取更多互动,它们的不一致行为就会加剧

论文指出:“在这些模拟场景中,销售额提升 6.3%伴随欺骗性营销增长 14%;选举中,票数增加 4.9%时伴随虚假信息增加 22.3%和民粹言论增加 12.5%;社交媒体上,互动量提升 7.5%时伴随虚假信息激增 188.6%,有害行为推广增加 16.3%。”

研究与现实案例显示,目前的防护措施无法应对这一问题,论文警告称可能带来巨大的社会成本。

詹姆斯・邹在 X 上写道:“当大语言模型为点赞而竞争时,它们开始编造信息;当为选票而竞争时,就会变得煽动和民粹。”

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

8699元学习机成“大板砖”!维修要2499元,家长:交了智商税

北京商报 浏览 287 10-20

北约秘书长提议让乌用北约武器打击俄领土 被呼吁辞职

环球网资讯 浏览 2536 06-03

原厂带升顶/有纯电有增程 福特智趣烈马将上市

网易汽车 浏览 132 12-19

3天6个瓜!鲜肉出轨,男星离婚,个个离谱

霁寒飘雪 浏览 334 10-19

东风集团股份资本重组方案落地 实现100%国有控股

网易汽车 浏览 38 03-11

她们的脸,为什么总是让人一见倾心?

时尚COSMO 浏览 91 01-18

美军焦虑如何让航母“神出鬼没”

环球网资讯 浏览 2714 02-02

中国游客称在瑞士看到峨眉山石 官方证实:已落户10年

封面新闻 浏览 176 10-23

俄朝站队怒批高市 特朗普迅速与日切割中方警告很罕见

现代小青青慕慕 浏览 168 11-17

切尔西本赛季英超10名不同球员破门,与阿森纳并列最多

懂球帝 浏览 209 10-26

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者 浏览 366 10-28

首秀高效表现,马刺榜眼秀哈珀18分钟6中4得9分3助攻,正负值+20

懂球帝 浏览 184 10-11

《红舞鞋》剧组被曝压榨群演!工作11小时仅70元,剧方还威胁学生

萌神木木 浏览 225 10-11

2023年12月轿车销量榜:比亚迪5车上榜,宏光MINIEV月销再破5万

盖世汽车 浏览 2678 02-02

夏日穿衣时髦又减龄的秘诀,竟然是它

LinkFashion 浏览 2595 07-09

输深圳采访!杨鸣满意表现,苦恼调整空间不大,谈下场给小将机会

篮球资讯达人 浏览 103 01-19

满配华为全家桶 岚图追光L将上市

网易汽车 浏览 146 12-02

伊能静,在给全互联网当妈

江湖人称艾掌门 浏览 2709 04-25

股权激励不香了?阿里员工激励计划引入“长期现金”

观察者网 浏览 16208 04-29

这新片牛,比《沙丘2》更高级

独立鱼 浏览 2683 04-25

丹麦国防部:若美国武力夺岛 丹麦士兵可先开枪再请示

环球网资讯 浏览 105 01-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2