发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

17岁高三生领衔Kimi团队创新,重构AI大模型核心架构获马斯克点赞

2026-03-23来源:天脉网编辑:瑞雪

中国人工智能领域迎来一项突破性进展——月之暗面(Moonshot AI)团队提出的"注意力残差"(Attention Residuals)架构引发全球关注。这项发表于开源平台的研究重构了Transformer模型的信息流动机制,通过引入动态注意力机制替代传统残差连接,使480亿参数模型训练效率提升1.25倍。特斯拉创始人埃隆·马斯克在社交平台转发表彰,称其为"令人印象深刻的创新"。

研究核心在于突破十年未变的模型架构范式。传统残差连接采用固定权重叠加各层输出,而新提出的AttnRes组件通过softmax注意力机制,使神经网络能够根据输入内容动态检索历史层信息。这种"深度维度自注意力"设计,实现了从线性累加到非线性聚合的范式转变。实验数据显示,在Kimi Linear架构中,该组件使模型在保持精度的同时显著降低计算成本。

论文作者团队呈现年轻化特征,三位主要贡献者中包括年仅17岁的高三学生陈广宇。这位来自深圳国际学校的少年,拥有美国计算机奥林匹克竞赛铂金组参赛经历,曾在Kimi内部黑客马拉松夺冠。尽管尚未完成高中学业,他已作为机器学习研究员参与开源大模型核心研发,与团队共同完成这项被业界视为"下一代模型关键模块"的研究。

陈广宇的学术轨迹颇具传奇色彩:入选罗德信托未来领袖计划、在美国Tilde Research实验室开展AI研究、以第一作者身份主导顶级AI企业核心架构论文。面对外界关注,他特别强调研究成果属于整个团队:"前三位作者贡献同等重要,Kimi每位成员都参与了关键环节。"这种超越年龄的学术视野,与其在竞技编程领域积累的算法优化经验形成有趣呼应。

月之暗面作为2023年成立的AI新锐,由清华系创业者杨植麟领衔,其开发的Kimi大模型多次在国际评测中比肩GPT-4等头部产品。此次架构创新不仅验证了中国团队在基础模型领域的研发实力,更通过开源方式推动全球技术进步。研究论文已完整公开在GitHub平台,为开发者提供可复现的技术方案。

从沉浸式通信到“空天地海”全覆盖 6G如何重塑未来智能生活?
武刚进一步解读了这一变革:“未来6G网络的核心是融入智能的通信,基站可能成为融入通用GPU/FPGA/AI芯片的异构通算一体的边缘智能平台,核心网络也可能融入大模型,从单纯传输信号与交换路由的‘管道’,演变成…

2026-03-23

麦积区第三届中小学创客大赛启幕 766名学子同台竞技共赴科技之约
本次大赛以“智创未来·数启成长”为主题,设置数字艺术、计算思维、创意制造、人工智能、航模竞赛5大类共20个竞赛项目,共吸引全区41支代表队、766名中小学生同台竞技,参赛规模较上届大幅增长90%,充分展现了…

2026-03-22

移动梦网2026年将停服!曾承载1亿人青春,文字网页里的旧时光
作为中国移动2000年在2G向2.5G过渡时期推出的移动数据业务品牌,移动梦网意为“Mobile+Internet”,曾囊括短信、彩信、手机上网(WAP)、手机游戏等多元服务。移动梦网是2G时代手机上网的重…

2026-03-22