发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

Kimi重塑大模型残差连接结构,训练效率提升1.25倍获马斯克点赞

2026-03-17来源:天脉网编辑:瑞雪

在人工智能领域,一项突破性研究引发了广泛关注。月之暗面Kimi团队近日宣布,对大模型核心架构中的残差连接模块进行了创新性重构。这项历经十年未有实质性突破的技术,通过引入动态注意力机制,使模型各层能够根据任务需求自主选择信息融合方式,打破了传统统一求和的固定模式。

研究团队由杨植麟、吴育昕、周昕宇等学者组成,他们通过重构信息传递路径,使模型在训练过程中能够动态调整各层间的信息流强度。实验数据显示,在480亿参数规模的模型训练中,该技术使计算效率提升25%,同时保持了模型性能的稳定性。这种创新设计不仅优化了资源利用率,更为超大规模模型训练提供了新的技术路径。

这项成果在学术圈引发连锁反应。特斯拉创始人埃隆·马斯克在社交平台转发研究论文时特别指出:"这种架构创新展现了深度学习领域令人兴奋的进展。"行业分析师认为,该研究通过重新定义信息融合机制,为解决大模型训练中的梯度消失问题提供了新思路,可能推动自然语言处理技术进入新的发展阶段。

技术报告显示,新架构在保持原有模型精度的前提下,将训练迭代次数减少了20%。研究团队透露,这项突破源于对生物神经网络信息处理方式的模拟研究,通过引入类似突触可塑性的动态调节机制,使人工神经网络获得更强的自适应能力。目前相关代码已开源,全球开发者均可基于该架构进行二次开发。

从工具到伙伴:科沃斯机器人如何以多元布局叩响具身智能未来之门?
于是在这届 AWE上,我们看到了作为「管家」的八界,以及作为「伙伴」的毛团儿,它们比扫地机器人「地宝」走得更远,正在慢慢丰富科沃斯的「具身智能」阵列。 从扫地机,到八界和毛团儿,每一步都是一次坚实的技术接…

2026-03-17

智元创新嘉兴再落子:全资子公司成立 聚焦智能机器人与AI开发
每经AI,天眼查工商信息显示,近日,智元创新(嘉兴)科技有限公司成立,法定代表人为邓泰华,注册资本100万元人民币,经营范围包括智能机器人的研发、智能机器人销售、人工智能理论与算法软件开发、人工智能应用软…

2026-03-17

京东发力具身智能数据采集,两年超千万小时数据驱动产业新飞跃
为推动行业健康快速发展,京东依托超级供应链核心优势,以及零售、物流、健康、工业、外卖、家政等海量真实业务场景,将建成全球规模最大、场景最全的具身智能数据采集中心,两年内积累超1000万小时优质数据,助力具身…

2026-03-17

有线网络卡顿、WiFi信号不稳?专业排查与升级方案助您畅享网络
2. AP设备老旧:当前使用的AP设备仅支持WiFi5协议,WiFi5的单流速率、并发连接能力有限,且抗干扰能力较弱,无法应对多设备同时连接(如办公场景下多台电脑、手机、平板并发)的需求,易出现连接不稳定、…

2026-03-17