主页 > 快资讯 > 正文

Step-3:颠覆性AI模型,低成本高效能引领AI新时代

2025-08-07 10:26来源:今日头条编辑:张易川

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  在2025年7月,StepFun公司的研究团队发布了一项革命性的研究,题为《Step-3 is Large yet Affordable: Model-system Co-design for Cost-effective Decoding》。这项研究彻底颠覆了大型AI模型成本高昂的传统认知,展示了一个拥有321亿参数的模型,通过创新设计,其运行成本竟然比许多参数更少的模型更低。该研究的完整论文可通过arXiv:2507.19427v1访问。

  在AI技术飞速发展的今天,大型语言模型被视为数字世界的超级大脑。然而,这些“大脑”在思考时消耗的计算资源巨大,运行成本高昂。StepFun团队面临的挑战是,如何设计一个既聪明又经济的“超级大脑”——Step-3。他们的解决方案是引入了一种全新的设计思维,即“注意力-前馈网络分离”(AFD)和多矩阵分解注意力(MFA)。

  传统的AI模型设计往往将注意力机制和前馈网络层层堆叠,类似于建造大楼的“叠积木”方式。而StepFun团队则采用了“工厂流水线”的思维,将注意力计算和前馈网络分别放在不同的“车间”独立运行,并通过精心设计的“传送带”传递中间结果。这种设计使得整个系统能够像现代汽车制造厂一样高效协调运作。

  更引人注目的是,Step-3采用了一种全新的注意力机制——多矩阵分解注意力(MFA)。传统的注意力机制需要记住所有对话内容,而MFA则像是一个聪明的秘书,用更少的“记忆空间”处理同样复杂的信息,同时保持极高的理解准确度。这一设计显著减少了Step-3在处理长篇对话时的存储空间需求,提高了计算效率。

  研究结果显示,在相同的硬件条件下,Step-3的解码成本比同类模型DeepSeek-V3降低了约40%,比Qwen3 MoE 235B也有显著优势。在H800 GPU上,Step-3的解码吞吐量达到每秒每GPU 4039个词汇单元,远超DeepSeek-V3的2324个。这些发现表明,通过硬件感知的模型-系统协同设计,可以在不牺牲模型能力的前提下,大幅降低AI服务的运营成本。

  Step-3的创新不仅在于技术突破,更在于其设计理念。研究团队发现,当前AI模型设计中存在两个普遍误区:一是过度追求减少“记忆负担”而忽视“思考效率”,二是盲目追求“专家系统”的稀疏性而忽略硬件特性。Step-3通过精心平衡注意力机制的计算强度、混合专家系统的稀疏度,以及硬件适配性,找到了这些因素之间的最佳平衡点。

  Step-3的核心架构创新在于将注意力和前馈网络完全分离,让它们各自在最适合的硬件上运行。这种设计不仅提高了计算效率,还使得系统可以根据实际负载动态调整配置比例,实现灵活的资源分配。Step-3的多矩阵分解注意力机制通过减少缓存需求并保持适中的计算强度,在各种硬件平台上都表现出色。

  为了充分发挥Step-3的性能,研究团队还开发了StepMesh通信库,这是一个高效的“神经系统”,用于协调各个部分的工作。StepMesh采用了异步处理架构、基于CPU的操作执行、预注册张量机制等多项创新技术,实现了超低延迟的数据传输,确保了Step-3各个组件的高效协调运行。

  在实际测试中,Step-3展现了压倒性的性能优势。与DeepSeek-V3相比,Step-3在H800硬件上的处理速度提升了74%,且在不同硬件平台上都能维持相对稳定的高性能表现。在成本效益方面,Step-3也表现出色,处理8K上下文长度的对话时,每100万词汇单元的成本仅为0.055美元,明显低于竞争对手。

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐
理想汽车、中国汽研、东风柳汽联袂声明:共塑 理想汽车、中国汽研、东风柳汽联袂声明:共塑

原标题:理想汽车、中国汽研、东风柳汽联袂声明:共塑良性竞合 近日,针对

行业资讯2025-08-07

一加2025上半年手机销量增速领跑全行业,刘宝有 一加2025上半年手机销量增速领跑全行业,刘宝有

在近期的高通骁龙游戏技术赏活动中,一加中国区品牌总经理刘宝有披露了公司

快资讯2025-08-07

2025上半年国内手机激活量排行:华为领跑,小米 2025上半年国内手机激活量排行:华为领跑,小米

近期,中国手机市场2025年上半年(1月至6月)的激活量数据被一位知名数码博主

快资讯2025-08-07

网络时代守护个人数据安全:四大要点助你安心 网络时代守护个人数据安全:四大要点助你安心

在当下的数字洪流中,个人数据安全已成为公众不可忽视的重大议题。每一次在

快资讯2025-08-07

智慧景区:科技引领旅游业转型升级与可持续发 智慧景区:科技引领旅游业转型升级与可持续发

在信息技术日新月异的今天,旅游业正经历着一场深刻的变革,智慧景区的兴起

快资讯2025-08-07

新一代扫地机之王,追觅首款分区清洁扫地机上 新一代扫地机之王,追觅首款分区清洁扫地机上

今日,追觅扫地机全新力作——追觅Matrix10 Ultra自动换拖布扫地机器人正式上线

快资讯2025-08-06

“人工智能+”浪潮下,TMT板块领跑市场涨幅榜 “人工智能+”浪潮下,TMT板块领跑市场涨幅榜

近期,人工智能领域内的焦点无疑聚焦于即将问世的GPT-5。该公司CEO频频在社交

快资讯2025-08-06

五招解决游戏卡顿,助你流畅畅玩告别延迟 五招解决游戏卡顿,助你流畅畅玩告别延迟

游戏玩家常常遭遇的一大困扰便是游戏过程中的画面卡顿,这不仅影响了操作的

快资讯2025-08-06

物联网卡采购新选择:专业服务商,灵活高效, 物联网卡采购新选择:专业服务商,灵活高效,

在物联网卡采购领域,企业时常面临抉择的难题:一边是资源丰富但服务模式僵

快资讯2025-08-06

荣耀“换机克隆”App升级:实现全品牌数据迁移 荣耀“换机克隆”App升级:实现全品牌数据迁移

荣耀近日在其应用市场中更新了“换机克隆”应用,此更新使得该应用能够支持

快资讯2025-08-06