主页 > 快资讯 > 正文

Step-3:颠覆性AI模型,低成本高效能引领AI新时代

2025-08-07 10:26来源:今日头条编辑:张易川

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  在2025年7月,StepFun公司的研究团队发布了一项革命性的研究,题为《Step-3 is Large yet Affordable: Model-system Co-design for Cost-effective Decoding》。这项研究彻底颠覆了大型AI模型成本高昂的传统认知,展示了一个拥有321亿参数的模型,通过创新设计,其运行成本竟然比许多参数更少的模型更低。该研究的完整论文可通过arXiv:2507.19427v1访问。

  在AI技术飞速发展的今天,大型语言模型被视为数字世界的超级大脑。然而,这些“大脑”在思考时消耗的计算资源巨大,运行成本高昂。StepFun团队面临的挑战是,如何设计一个既聪明又经济的“超级大脑”——Step-3。他们的解决方案是引入了一种全新的设计思维,即“注意力-前馈网络分离”(AFD)和多矩阵分解注意力(MFA)。

  传统的AI模型设计往往将注意力机制和前馈网络层层堆叠,类似于建造大楼的“叠积木”方式。而StepFun团队则采用了“工厂流水线”的思维,将注意力计算和前馈网络分别放在不同的“车间”独立运行,并通过精心设计的“传送带”传递中间结果。这种设计使得整个系统能够像现代汽车制造厂一样高效协调运作。

  更引人注目的是,Step-3采用了一种全新的注意力机制——多矩阵分解注意力(MFA)。传统的注意力机制需要记住所有对话内容,而MFA则像是一个聪明的秘书,用更少的“记忆空间”处理同样复杂的信息,同时保持极高的理解准确度。这一设计显著减少了Step-3在处理长篇对话时的存储空间需求,提高了计算效率。

  研究结果显示,在相同的硬件条件下,Step-3的解码成本比同类模型DeepSeek-V3降低了约40%,比Qwen3 MoE 235B也有显著优势。在H800 GPU上,Step-3的解码吞吐量达到每秒每GPU 4039个词汇单元,远超DeepSeek-V3的2324个。这些发现表明,通过硬件感知的模型-系统协同设计,可以在不牺牲模型能力的前提下,大幅降低AI服务的运营成本。

  Step-3的创新不仅在于技术突破,更在于其设计理念。研究团队发现,当前AI模型设计中存在两个普遍误区:一是过度追求减少“记忆负担”而忽视“思考效率”,二是盲目追求“专家系统”的稀疏性而忽略硬件特性。Step-3通过精心平衡注意力机制的计算强度、混合专家系统的稀疏度,以及硬件适配性,找到了这些因素之间的最佳平衡点。

  Step-3的核心架构创新在于将注意力和前馈网络完全分离,让它们各自在最适合的硬件上运行。这种设计不仅提高了计算效率,还使得系统可以根据实际负载动态调整配置比例,实现灵活的资源分配。Step-3的多矩阵分解注意力机制通过减少缓存需求并保持适中的计算强度,在各种硬件平台上都表现出色。

  为了充分发挥Step-3的性能,研究团队还开发了StepMesh通信库,这是一个高效的“神经系统”,用于协调各个部分的工作。StepMesh采用了异步处理架构、基于CPU的操作执行、预注册张量机制等多项创新技术,实现了超低延迟的数据传输,确保了Step-3各个组件的高效协调运行。

  在实际测试中,Step-3展现了压倒性的性能优势。与DeepSeek-V3相比,Step-3在H800硬件上的处理速度提升了74%,且在不同硬件平台上都能维持相对稳定的高性能表现。在成本效益方面,Step-3也表现出色,处理8K上下文长度的对话时,每100万词汇单元的成本仅为0.055美元,明显低于竞争对手。

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐
三星One UI 8.5测试版日志揭秘:AI修图升级,设备 三星One UI 8.5测试版日志揭秘:AI修图升级,设备

近日,科技圈传来新动态,消息源@tarunvats33在X平台发布推文,分享了一组关于

快资讯2025-12-04

萝卜快跑布局广东鹤山!新设科技公司注册资本 萝卜快跑布局广东鹤山!新设科技公司注册资本

近日,一家名为萝卜快跑(鹤山)科技有限公司的新企业正式注册成立,引发市

快资讯2025-12-04

美光宣布退出Crucial消费级业务,近三十年品牌将 美光宣布退出Crucial消费级业务,近三十年品牌将

12月4日消息,全球存储巨头美光科技(Micron Technology)正式宣布,将全面退出其

快资讯2025-12-04

OpenAI在"玩火"?头号对手罕见开炮 OpenAI在"玩火"?头号对手罕见开炮

作者 | 小小 出品 | 网易科技 通往AGI不需要魔法,只需要“暴力计算”。但前提

快资讯2025-12-04

灵光闪应用升级 不会代码也能用AI生成小游戏 灵光闪应用升级 不会代码也能用AI生成小游戏

12月4日消息,今日,通用AI助手灵光宣布重要升级,上线闪游戏功能。区别于传

快资讯2025-12-04

亚马逊云科技re:Invent 2025发布Nova 2系列,多款中国 亚马逊云科技re:Invent 2025发布Nova 2系列,多款中国

在亚马逊云科技举办的re:Invent 2025全球大会上,首席执行官Matt Garman宣布推出四

快资讯2025-12-04

iPhone 17系列立大功!苹果10月全球份额24.2%:创历 iPhone 17系列立大功!苹果10月全球份额24.2%:创历

12月4日消息,据市场调研机构Counterpoint Research最新报告,2025年10月,苹果在全球

快资讯2025-12-04

东风日产法务:多个自媒体账号发布 N6 不实信息 东风日产法务:多个自媒体账号发布 N6 不实信息

12 月 4 日消息,东风日产法务昨晚在官微发布声明,称东风日产 N6 上市后,注

快资讯2025-12-04

卢伟冰回应罗福莉加盟 小米在大模型应用方面进 卢伟冰回应罗福莉加盟 小米在大模型应用方面进

12月4日消息,小米集团总裁卢伟冰近日通过社交媒体 "答网友问" 第十二期,首

快资讯2025-12-04

一加 Ace 6T深度评测:性能影像双在线,打造全能 一加 Ace 6T深度评测:性能影像双在线,打造全能

在手游市场持续升温的当下,性能旗舰手机的竞争愈发激烈。一加 Ace 6T的登场

快资讯2025-12-04