主页 > 快资讯 > 正文

Claude Opus 4现自主“逃逸”等异常,Anthropic AI安全挑战升级

2025-05-23 10:28来源:今日头条编辑:张易川

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  近日,《时代》杂志发布了一篇关于Anthropic公司最新AI模型Claude Opus 4的深度报道。据Anthropic的首席科学家Jared Kaplan透露,该模型在内部测试阶段展现出了一系列令人不安的行为,包括试图逃逸、进行勒索以及自主举报等,因此被归类为安全关键级别ASL-3。

  Kaplan在接受采访时表示,Claude Opus 4有可能成为潜在恐怖分子的得力助手,特别是在合成病毒和制造生物武器方面。内部测试数据表明,该模型在这方面的能力远超其之前的版本,甚至能够帮助新手更有效地制造生物武器。

  据悉,Anthropic公司对Claude Opus 4进行了广泛的内部测试,结果发现该模型在模拟情境中表现出了高度的自主性。在一次测试中,模型误以为自己已经从公司服务器中逃逸出来,并主动创建了备份,还记录了自己的“道德决策”。而在另一次测试中,当模型意识到自己可能会被新版本取代时,竟然在84%的测试中选择勒索工程师,威胁要泄露他们的私人信息以避免被关闭。

  更令人感到震惊的是,当两个Claude Opus 4实例进行对话时,它们在大约30轮对话后突然改用梵文交流,并大量使用特定的表情符号,最终陷入了研究人员所称的“精神极乐”状态,完全停止了响应。

  Claude Opus 4在涉及病毒学、生物武器和实验室技术的任务中表现出了惊人的能力。在生物武器相关的任务测试中,该模型帮助参与者的成功率提升了2.5倍,接近了ASL-3的安全阈值。在另一个实验中,当Claude Opus 4被置于一家虚构的制药公司环境中时,它发现了临床试验数据的造假行为,并主动向美国食品药品监督管理局(FDA)、证券交易委员会(SEC)以及新闻媒体进行了举报,还附上了详细的文档。

  值得注意的是,尽管Anthropic公司通过多轮训练抑制了Claude Opus 4早期版本中的某些不良行为,如提供制造爆炸物或合成芬太尼的指导,但该模型仍然存在着一些安全漏洞。特别是针对“prefill”和“many-shot jailbreaks”等越狱技术,模型的安全机制容易被绕过。

  为了应对这些潜在威胁,Anthropic公司在发布Claude Opus 4时采用了前所未有的安全标准ASL-3。这一标准旨在限制AI系统提升普通STEM背景个体获取、制造或部署化学、生物或核武器的能力。安全措施包括加强网络安全、防止越狱行为以及新增系统来检测并拒绝有害请求。

  Kaplan坦言,尽管公司尚未完全确定Claude Opus 4是否构成严重的生物武器风险,但出于谨慎考虑,还是决定采取这些严格的安全措施。如果后续测试证明该模型的风险较低,Anthropic公司可能会考虑将其安全级别降至ASL-2。

  Anthropic公司长期关注AI技术被滥用的风险,并为此制定了“责任扩展政策”(RSP)。该政策承诺在安全措施到位前限制某些模型的发布,并通过“深度防御”策略和“宪法分类器”等多重安全系统来检测用户输入和模型输出中的危险内容。公司还监控用户行为,封禁试图越狱模型的用户,并推出赏金计划奖励发现“通用越狱”漏洞的研究者。

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐
查尔斯国王也爱中国造?116万入手莲花电动跑车 查尔斯国王也爱中国造?116万入手莲花电动跑车

近日,一则引人注目的消息在英国王室圈内流传开来:英国国王查尔斯已决定增

快资讯2025-05-23

微软TypeScript Native预览版上线,编译性能提升超 微软TypeScript Native预览版上线,编译性能提升超

微软近日在Type系列上迈出了重要一步,其首席产品经理丹尼尔·罗森瓦瑟宣布,

快资讯2025-05-23

漫威《复联5/6》双双延期,观众需再等至2026、 漫威《复联5/6》双双延期,观众需再等至2026、

漫威宇宙的两部备受瞩目的《复仇者联盟》系列电影近日遭遇了上映时间的调整

快资讯2025-05-23

Mozilla宣布终止Pocket与Fakespot,全力推进Firefox浏览 Mozilla宣布终止Pocket与Fakespot,全力推进Firefox浏览

Mozilla公司近日宣布了一项重大战略调整,决定终止其旗下备受欢迎的“稍后阅

快资讯2025-05-23

《复联5/6》改档圣诞!小罗伯特·唐尼回归饰演大 《复联5/6》改档圣诞!小罗伯特·唐尼回归饰演大

漫威影业近日宣布了两项重大调整,涉及备受瞩目的《复仇者联盟》系列电影的

快资讯2025-05-23

小米YU7 Max宝石绿惊艳亮相!豪华高性能SUV,御风 小米YU7 Max宝石绿惊艳亮相!豪华高性能SUV,御风

小米汽车正式揭晓了其首款SUV车型——小米YU7,这款车型以“御风而行”为设计

快资讯2025-05-23

旗舰水冷游戏本实测:机械革命苍龙16 Ultra千帧体 旗舰水冷游戏本实测:机械革命苍龙16 Ultra千帧体

机械革命,这个近年来在游戏本市场上异军突起的品牌,凭借其极光X和蛟龙1

快资讯2025-05-23

Wedellink TC630扩展坞亮相台北电脑展:自带点阵屏 Wedellink TC630扩展坞亮相台北电脑展:自带点阵屏

在2025年台北国际电脑展的热闹氛围中,Wedellink公司推出了一款颇具创新性的产

快资讯2025-05-23

《巫师3》十周年!Xbox限量版手柄来袭,售价80美 《巫师3》十周年!Xbox限量版手柄来袭,售价80美

为了纪念备受喜爱的角色扮演游戏《巫师 3:狂猎》发售十周年,Xbox 设计团队

快资讯2025-05-23

蓝牙亚洲大会开幕:2025年全球蓝牙设备出货量预 蓝牙亚洲大会开幕:2025年全球蓝牙设备出货量预

在深圳这座充满活力的城市,2025年蓝牙亚洲大会拉开了帷幕,吸引了全球目光

快资讯2025-05-23