主页 > 快资讯 > 正文

AI无稳定价值观?MIT研究发现“对齐”AI挑战重重

2025-04-10 10:27来源:今日头条编辑:张易川

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  近期,关于人工智能(AI)是否可能发展出自身“价值体系”的讨论引起了广泛关注。有研究报告指出,随着AI技术的日益复杂,其可能会形成优先考虑自身而非人类福祉的价值观。然而,麻省理工学院(MIT)的一项最新研究却对此观点提出了质疑。

  MIT的研究团队在论文中指出,AI实际上并没有任何连贯的价值观。这一发现让一些人对AI的未来发展有了更为冷静的思考。研究团队表示,他们的研究结果显示,使AI系统“对齐”,即确保AI模型以人们期望的、可靠的方式行事,可能比原先认为的要更具挑战性。

  研究团队进一步解释说,现有的AI模型会产生“幻觉”并进行模仿,这使得它们在很多情况下难以预测。MIT博士生、该研究的共同作者斯蒂芬·卡斯珀在接受采访时提到:“我们可以确定的一点是,模型并不遵循许多稳定性、可外推性和可操控性的假设。”

  为了深入了解AI模型的价值观表现,卡斯珀和他的同事们对来自meta、谷歌、Mistral、OpenAI和Anthropic的多个近期模型进行了研究。他们试图了解这些模型在多大程度上表现出强烈的“观点”和价值观,例如个人主义与集体主义,并探索这些观点是否可以被“引导”或修改,以及模型在不同情境下对这些观点的坚持程度。

  然而,研究结果显示,这些模型在偏好上表现出极大的不一致性。根据不同的提示措辞和框架,它们会展现出截然不同的观点。卡斯珀认为,这是有力的证据,表明AI模型高度“不一致且不稳定”,甚至可能根本无法形成类似人类的偏好。

  卡斯珀进一步强调:“通过所有这些研究,我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。相反,它们本质上是模仿者,会进行各种捏造,并说出各种轻率的话。”这一发现让人们重新审视了AI的价值观问题,也引发了对于如何更好地控制和引导AI行为的思考。

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐
微信“后悔药”上线:5秒黄金时间,误删信息可 微信“后悔药”上线:5秒黄金时间,误删信息可

在繁忙的数字生活中,每一个小小的失误都可能带来不小的麻烦。想象一下,你

快资讯2025-07-23

微信“后悔药”实测:5秒撤销,真的能救急还是 微信“后悔药”实测:5秒撤销,真的能救急还是

近日,一条关于微信新功能的消息在朋友圈引起了广泛关注:“手滑误删工作群

快资讯2025-07-23

直言华为比NVIDIA大得多!黄仁勋狂夸华为:到底 直言华为比NVIDIA大得多!黄仁勋狂夸华为:到底

原标题:直言华为比NVIDIA大得多!黄仁勋狂夸华为:到底是战略布局还是真心话

行业资讯2025-07-23

小鹏MONA连续十月交付破万,上半年累计交付近 小鹏MONA连续十月交付破万,上半年累计交付近

原标题:小鹏MONA连续十月交付破万,上半年累计交付近20万台 小鹏汽车近日在

行业资讯2025-07-23

马斯克xAI筹巨资,剑指五年5000万块H100等效算力, 马斯克xAI筹巨资,剑指五年5000万块H100等效算力,

原标题:马斯克xAI筹巨资,剑指五年5000万块H100等效算力,领跑AI军备竞赛 近期

行业资讯2025-07-23

通用汽车中国市场销量大增20%,连续三季盈利, 通用汽车中国市场销量大增20%,连续三季盈利,

原标题:通用汽车中国市场销量大增20%,连续三季盈利,业绩回暖迹象明显 通

行业资讯2025-07-23

误删小米回收站照片别急!三步教你高效找回珍 误删小米回收站照片别急!三步教你高效找回珍

在数字化生活的快节奏中,手机已成为我们记录生活点滴的重要工具。然而,一

快资讯2025-07-23

严打“帅哥/美女带团游北京”套路,抖音生活服 严打“帅哥/美女带团游北京”套路,抖音生活服

近日,抖音生活服务在平台巡检中发现,个别账号以“美女/帅哥带团游北京”

快资讯2025-07-23

Roblox下载故障不求人:核心难题解析与高效解决 Roblox下载故障不求人:核心难题解析与高效解决

Roblox,这款充满创意与互动乐趣的游戏平台,一直以来都深受全球年轻玩家的喜

快资讯2025-07-22

OPPO携手阿里云,大数据平台实现云端迁移新突破 OPPO携手阿里云,大数据平台实现云端迁移新突破

近期,阿里云宣布与智能手机制造商OPPO携手,成功将OPPO庞大的大数据平台迁移

快资讯2025-07-22