主页 > 快资讯 > 正文

苹果研究揭示:主流AI推理模型,真的缺乏思考能力吗?

2025-06-09 14:29来源:今日头条编辑:张易川

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  近期,苹果公司发布了一篇引人注目的研究论文,该论文对传统上被认为是“推理”的人工智能模型的能力提出了深刻质疑。论文指出,尽管诸如DeepSeek、o3-mini和Claude 3.7等模型在市场上广受关注,但它们所展现的推理能力,实质上仍局限于模式匹配的范畴,并未真正具备逻辑推导的能力。

  为了对这一观点进行更为严谨的验证,苹果的研究团队设计了一系列结构化谜题任务,包括汉诺塔问题、跳棋交换问题、过河问题以及积木世界等。这些任务不仅具有高度的复杂性,而且可以通过调整参数来精确控制难度,从而实现对模型推理能力的系统性评估。

  实验结果显示,当任务难度逐渐增加时,这些模型虽然在一开始表现出一定的适应能力,如延长生成回应前的等待时间,但随着任务难度的进一步攀升,模型的推理深度却开始减弱。在最为关键的时刻,即使模型仍有充足的token预算,它们也未能进一步深入分析,而是选择了停止。当任务难度超过某个临界值时,所有模型,包括那些专为推理设计的模型,都完全丧失了基本的解题能力,准确率迅速归零,呈现出明显的性能崩溃。

  这篇论文一经发布,立即在网络上引发了广泛的讨论。一些用户批评苹果,认为作为拥有雄厚资金支持的科技公司,苹果在近年来并未推出具有突破性的技术成果,反而对行业内其他公司的进展提出质疑。然而,也有观点认为,这篇论文的意图并非全盘否定现有的技术成果,而是希望推动业界对更为有效的推理机制和评估方法进行更为深入的探索和研究。

  值得注意的是,苹果在2024年的全球开发者大会上首次展示了其智能系统Apple Intelligence。然而,该系统在过去一年中遭遇了多项功能的推迟上线、功能不完善甚至被撤回的情况。这一背景或许为苹果此次发布论文提供了更为复杂的动机,即希望通过揭示当前模型的局限性,激发业界对更有效推理机制和评估方法的关注和投入。

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐
微信“后悔药”上线:5秒黄金时间,误删信息可 微信“后悔药”上线:5秒黄金时间,误删信息可

在繁忙的数字生活中,每一个小小的失误都可能带来不小的麻烦。想象一下,你

快资讯2025-07-23

微信“后悔药”实测:5秒撤销,真的能救急还是 微信“后悔药”实测:5秒撤销,真的能救急还是

近日,一条关于微信新功能的消息在朋友圈引起了广泛关注:“手滑误删工作群

快资讯2025-07-23

直言华为比NVIDIA大得多!黄仁勋狂夸华为:到底 直言华为比NVIDIA大得多!黄仁勋狂夸华为:到底

原标题:直言华为比NVIDIA大得多!黄仁勋狂夸华为:到底是战略布局还是真心话

行业资讯2025-07-23

小鹏MONA连续十月交付破万,上半年累计交付近 小鹏MONA连续十月交付破万,上半年累计交付近

原标题:小鹏MONA连续十月交付破万,上半年累计交付近20万台 小鹏汽车近日在

行业资讯2025-07-23

马斯克xAI筹巨资,剑指五年5000万块H100等效算力, 马斯克xAI筹巨资,剑指五年5000万块H100等效算力,

原标题:马斯克xAI筹巨资,剑指五年5000万块H100等效算力,领跑AI军备竞赛 近期

行业资讯2025-07-23

通用汽车中国市场销量大增20%,连续三季盈利, 通用汽车中国市场销量大增20%,连续三季盈利,

原标题:通用汽车中国市场销量大增20%,连续三季盈利,业绩回暖迹象明显 通

行业资讯2025-07-23

误删小米回收站照片别急!三步教你高效找回珍 误删小米回收站照片别急!三步教你高效找回珍

在数字化生活的快节奏中,手机已成为我们记录生活点滴的重要工具。然而,一

快资讯2025-07-23

严打“帅哥/美女带团游北京”套路,抖音生活服 严打“帅哥/美女带团游北京”套路,抖音生活服

近日,抖音生活服务在平台巡检中发现,个别账号以“美女/帅哥带团游北京”

快资讯2025-07-23

Roblox下载故障不求人:核心难题解析与高效解决 Roblox下载故障不求人:核心难题解析与高效解决

Roblox,这款充满创意与互动乐趣的游戏平台,一直以来都深受全球年轻玩家的喜

快资讯2025-07-22

OPPO携手阿里云,大数据平台实现云端迁移新突破 OPPO携手阿里云,大数据平台实现云端迁移新突破

近期,阿里云宣布与智能手机制造商OPPO携手,成功将OPPO庞大的大数据平台迁移

快资讯2025-07-22