主页 > 快资讯 > 正文

科大讯飞华为联手,“飞星一号”MoE模型集群推理性能翻倍突破极限!

2025-04-18 18:28来源:今日头条编辑:张易川

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  科大讯飞与华为昇腾携手,在“飞星一号”平台上实现了MoE模型集群推理性能的显著提升。这一突破性进展,标志着国产算力在AI领域的应用迈出了重要一步。

  据悉,双方联合团队通过一系列创新优化手段,成功将MoE模型在“飞星一号”平台上的集群推理性能翻倍。这一成就不仅彰显了国产算力在处理复杂AI任务方面的潜力,更为AI技术的广泛应用提供了有力支持。

  在此次优化过程中,联合团队针对MoE模型的特性,升级了PD分离+大规模专家并行系统解决方案。他们通过定制集合通信协议,有效消除了集合通信流量冲突,解决了推理过程中Prefill阶段和Decode阶段的相互干扰问题。这一创新举措使得P实例和D实例均达到了系统最优状态,性能提升超过20%。

  联合团队还在国产算力上实现了MTP多token预测技术,这一技术的引入显著降低了MTP层的计算耗时,整体性能提升超过30%。同时,他们还对专家负载均衡算法进行了升级,实现了多DP负载均衡,卡间负载均衡差异小于8%,集群推理吞吐性能因此提升了30%以上。

  联合团队还创新性地实现了异步双发射技术。这一技术有效解决了高并发下的高CPU负载问题,实现了CPU和NPU的高效协同。通过降低服务请求调度耗时,系统性能得到了进一步提升,提升幅度达到10%。

  基于上述一系列创新解决方案的迭代与升级,联合团队在“飞星一号”平台上对星火MoE模型、DeepSeekV3/R1进行了实测。测试结果显示,推理性能相较于上一个版本有了显著提升,几乎逼近了国产算力上MoE集群推理的性能上限。这一突破性进展无疑为国产算力在AI领域的应用注入了新的活力。

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐
三星One UI 8.5测试版日志揭秘:AI修图升级,设备 三星One UI 8.5测试版日志揭秘:AI修图升级,设备

近日,科技圈传来新动态,消息源@tarunvats33在X平台发布推文,分享了一组关于

快资讯2025-12-04

萝卜快跑布局广东鹤山!新设科技公司注册资本 萝卜快跑布局广东鹤山!新设科技公司注册资本

近日,一家名为萝卜快跑(鹤山)科技有限公司的新企业正式注册成立,引发市

快资讯2025-12-04

美光宣布退出Crucial消费级业务,近三十年品牌将 美光宣布退出Crucial消费级业务,近三十年品牌将

12月4日消息,全球存储巨头美光科技(Micron Technology)正式宣布,将全面退出其

快资讯2025-12-04

OpenAI在"玩火"?头号对手罕见开炮 OpenAI在"玩火"?头号对手罕见开炮

作者 | 小小 出品 | 网易科技 通往AGI不需要魔法,只需要“暴力计算”。但前提

快资讯2025-12-04

灵光闪应用升级 不会代码也能用AI生成小游戏 灵光闪应用升级 不会代码也能用AI生成小游戏

12月4日消息,今日,通用AI助手灵光宣布重要升级,上线闪游戏功能。区别于传

快资讯2025-12-04

亚马逊云科技re:Invent 2025发布Nova 2系列,多款中国 亚马逊云科技re:Invent 2025发布Nova 2系列,多款中国

在亚马逊云科技举办的re:Invent 2025全球大会上,首席执行官Matt Garman宣布推出四

快资讯2025-12-04

iPhone 17系列立大功!苹果10月全球份额24.2%:创历 iPhone 17系列立大功!苹果10月全球份额24.2%:创历

12月4日消息,据市场调研机构Counterpoint Research最新报告,2025年10月,苹果在全球

快资讯2025-12-04

东风日产法务:多个自媒体账号发布 N6 不实信息 东风日产法务:多个自媒体账号发布 N6 不实信息

12 月 4 日消息,东风日产法务昨晚在官微发布声明,称东风日产 N6 上市后,注

快资讯2025-12-04

卢伟冰回应罗福莉加盟 小米在大模型应用方面进 卢伟冰回应罗福莉加盟 小米在大模型应用方面进

12月4日消息,小米集团总裁卢伟冰近日通过社交媒体 "答网友问" 第十二期,首

快资讯2025-12-04

一加 Ace 6T深度评测:性能影像双在线,打造全能 一加 Ace 6T深度评测:性能影像双在线,打造全能

在手游市场持续升温的当下,性能旗舰手机的竞争愈发激烈。一加 Ace 6T的登场

快资讯2025-12-04