主页 > 快资讯 > 正文

英伟达推出Nemotron Ultra:2530亿参数大模型,突破AI推理与部署效率

2025-04-12 18:27来源:今日头条编辑:张易川

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  近期,科技界传来了一则令人瞩目的消息。据知名科技媒体marktechpost报道,英伟达公司于近日正式推出了其最新研发的大型语言模型——Llama-3.1-Nemotron-Ultra-253B-v1,业界简称为Nemotron Ultra。这款模型拥有2530亿个参数,在推理能力、架构效率以及生产准备度方面实现了显著的提升,为AI技术的发展注入了新的活力。

  随着AI技术在数字基础设施中的广泛应用,企业和开发者面临着计算成本、性能与扩展性之间的平衡挑战。大型语言模型(LLM)虽然能够显著提升自然语言理解和对话能力,但其庞大的规模往往导致效率低下,难以进行大规模部署。针对这一难题,Nemotron Ultra应运而生。

  Nemotron Ultra基于meta的Llama-3.1-405B-Instruct架构,专为满足商业和企业需求而设计。它能够支持从工具使用到多轮复杂指令执行等多种任务,为企业提供了强大的支持。在架构上,该模型采用了仅解码器的密集Transformer结构,并通过神经架构搜索(NAS)算法进行了优化。其创新之处在于引入了跳跃注意力机制,在部分层中省略了注意力模块或替换为简单的线性层,从而提高了模型的效率。

  Nemotron Ultra还采用了前馈网络(FFN)融合技术,将多层FFN合并为更宽但更少的层,进一步缩短了推理时间,同时保持了卓越的性能。该模型支持高达128K token的上下文窗口,能够处理长篇文本,非常适合用于高级RAG系统和多文档分析。

  在部署效率方面,Nemotron Ultra同样表现出色。它能够在单个8xH100节点上运行推理,显著降低了数据中心的成本,提高了企业开发者的可及性。这一突破性的进展使得大型语言模型在商业应用中的部署变得更加高效和便捷。

  为了进一步优化模型性能,英伟达还采取了多阶段后训练策略。这包括在代码生成、数学、对话和工具调用等任务上进行监督微调,以及使用群体相对策略优化(GRPO)算法进行强化学习(RL)。这些措施确保了Nemotron Ultra在基准测试中表现出色,并且能够与人类交互偏好高度契合,为用户带来更加自然、流畅的体验。

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐
三星One UI 8.5测试版日志揭秘:AI修图升级,设备 三星One UI 8.5测试版日志揭秘:AI修图升级,设备

近日,科技圈传来新动态,消息源@tarunvats33在X平台发布推文,分享了一组关于

快资讯2025-12-04

萝卜快跑布局广东鹤山!新设科技公司注册资本 萝卜快跑布局广东鹤山!新设科技公司注册资本

近日,一家名为萝卜快跑(鹤山)科技有限公司的新企业正式注册成立,引发市

快资讯2025-12-04

美光宣布退出Crucial消费级业务,近三十年品牌将 美光宣布退出Crucial消费级业务,近三十年品牌将

12月4日消息,全球存储巨头美光科技(Micron Technology)正式宣布,将全面退出其

快资讯2025-12-04

OpenAI在"玩火"?头号对手罕见开炮 OpenAI在"玩火"?头号对手罕见开炮

作者 | 小小 出品 | 网易科技 通往AGI不需要魔法,只需要“暴力计算”。但前提

快资讯2025-12-04

灵光闪应用升级 不会代码也能用AI生成小游戏 灵光闪应用升级 不会代码也能用AI生成小游戏

12月4日消息,今日,通用AI助手灵光宣布重要升级,上线闪游戏功能。区别于传

快资讯2025-12-04

亚马逊云科技re:Invent 2025发布Nova 2系列,多款中国 亚马逊云科技re:Invent 2025发布Nova 2系列,多款中国

在亚马逊云科技举办的re:Invent 2025全球大会上,首席执行官Matt Garman宣布推出四

快资讯2025-12-04

iPhone 17系列立大功!苹果10月全球份额24.2%:创历 iPhone 17系列立大功!苹果10月全球份额24.2%:创历

12月4日消息,据市场调研机构Counterpoint Research最新报告,2025年10月,苹果在全球

快资讯2025-12-04

东风日产法务:多个自媒体账号发布 N6 不实信息 东风日产法务:多个自媒体账号发布 N6 不实信息

12 月 4 日消息,东风日产法务昨晚在官微发布声明,称东风日产 N6 上市后,注

快资讯2025-12-04

卢伟冰回应罗福莉加盟 小米在大模型应用方面进 卢伟冰回应罗福莉加盟 小米在大模型应用方面进

12月4日消息,小米集团总裁卢伟冰近日通过社交媒体 "答网友问" 第十二期,首

快资讯2025-12-04

一加 Ace 6T深度评测:性能影像双在线,打造全能 一加 Ace 6T深度评测:性能影像双在线,打造全能

在手游市场持续升温的当下,性能旗舰手机的竞争愈发激烈。一加 Ace 6T的登场

快资讯2025-12-04