主页 > 快资讯 > 正文

DeepSeek新年首篇论文问世:mHC新架构登场 梁文锋位列作者团队

2026-01-02 06:26来源:今日头条编辑:张易川

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  近日,人工智能领域迎来一项重要突破,DeepSeek团队公布了一篇关于新型神经网络架构的研究论文,提出名为“流形约束超连接”(mHC)的创新框架。该研究针对传统超连接技术在大规模模型训练中存在的稳定性问题展开探索,旨在通过结构优化实现性能与效率的双重提升。

  论文核心团队由三位年轻研究者主导,分别是解振达、韦毅轩与曹焕琦,DeepSeek创始人梁文锋亦参与其中。研究指出,近年来以超连接(HC)为代表的技术通过拓宽残差流路径、丰富连接模式,显著提升了模型性能,但这种复杂化设计破坏了残差连接固有的恒等映射特性,导致训练过程易出现不稳定现象,同时伴随高昂的内存访问成本,限制了技术的进一步扩展。

  针对上述痛点,mHC框架通过数学投影将超连接的残差空间约束至特定流形结构,在保留多样化连接优势的同时,重构了恒等映射的稳定性基础。研究团队同步开发了配套的基础设施优化方案,确保新架构在硬件层面的高效运行。实验数据显示,该技术在大规模训练场景中表现出色,不仅实现了性能的实质性提升,更展现出优异的扩展能力。

  这项成果被视为对神经网络拓扑设计的重要补充。研究团队认为,mHC作为超连接技术的实用化延伸,为理解复杂架构的内在机制提供了新视角,其设计理念或可推动基础模型向更高效、更稳定的方向演进。目前,相关代码与实验细节已通过论文形式公开,供学术界与产业界验证参考。

     投稿邮箱:jiujiukejiwang@163.com   详情访问99科技网:http://www.fun99.cn

相关推荐
三星计划使今年部署谷歌Gemini AI的移动设备数量 三星计划使今年部署谷歌Gemini AI的移动设备数量

1 月 5 日消息,据路透社今日报道,三星电子正在加速扩大 Gemini AI 的覆盖范围

快资讯2026-01-17

消息称字节跳动豆包AI眼镜即将进入出货阶段 消息称字节跳动豆包AI眼镜即将进入出货阶段

1 月 5 日消息,蓝鲸科技今日援引“多位供应链人士”消息称,字节跳动豆包

快资讯2026-01-17

零跑首款MPV车型D99亮相:定位30万元级旗舰产品 零跑首款MPV车型D99亮相:定位30万元级旗舰产品

12月28日消息,在今日举行的零跑汽车十周年发布会上,旗下首款MPV车型零跑D

快资讯2026-01-17

消息称英伟达计划今年一季度重新生产RTX 3060显卡 消息称英伟达计划今年一季度重新生产RTX 3060显卡

1 月 5 日消息,英伟达在去年开始逐步停产 RTX 3060 显卡,这款产品最初发布于

快资讯2026-01-17

奇富科技Lumo AI合规智能体连获三奖 奇富科技Lumo AI合规智能体连获三奖

1月5日消息,中国互联网协会主办的2025“人工智能+”产业生态大会首届“AI领航

快资讯2026-01-17

特好看,爆能打!iQOO Z11 Turbo重塑中端机天花板 特好看,爆能打!iQOO Z11 Turbo重塑中端机天花板

2026年1月15日,iQOO正式发布全新战斗精灵iQOO Z11 Turbo,以特好看、爆能打的产品

快资讯2026-01-17

零跑首款MPV车型D99亮相:定位30万元级旗舰产品 零跑首款MPV车型D99亮相:定位30万元级旗舰产品

12月28日消息,在今日举行的零跑汽车十周年发布会上,旗下首款MPV车型零跑D

快资讯2026-01-17

奇富科技Lumo AI合规智能体连获三奖 奇富科技Lumo AI合规智能体连获三奖

1月5日消息,中国互联网协会主办的2025“人工智能+”产业生态大会首届“AI领航

快资讯2026-01-16

智能手机的2025:厮杀、阵痛与价值重塑 智能手机的2025:厮杀、阵痛与价值重塑

2025年的中国智能手机市场,上演了一场反常规的“大戏”。 年初,行业共识还

快资讯2026-01-16

气象自动观测系统:以六大模块构筑精准防线, 气象自动观测系统:以六大模块构筑精准防线,

在现代气象观测领域,气象自动观测系统已成为不可或缺的关键支撑,广泛应用

快资讯2026-01-16