发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

小米机器人新突破:Xiaomi-Robotics-0发布,消费级显卡畅跑真机

2026-02-12来源:快讯编辑:瑞雪

今日,小米在机器人领域抛出一枚重磅炸弹——小米机器人团队正式发布并开源全新具身智能VLA模型Xiaomi-Robotics-0,其真机运行画面首次对外公开,瞬间引发行业高度关注。

长久以来,机器人模型发展面临诸多阻碍。一方面,传统VLA模型虽参数规模可观、泛化能力不错,但在真实物理世界中,推理延迟高的问题极为突出,导致机器人动作断断续续,如同“延迟卡顿的木偶”,难以像人类一样自然流畅地操作,被网友戏称为“反应迟钝的木头人”。另一方面,具备高性能的模型往往依赖昂贵的专业显卡才能运行,普通开发者和小团队根本无力承担,使得先进技术只能被困在实验室,无法实现落地普及。不少模型还存在“仿真测试成绩优异,一上真机就表现不佳”的尴尬状况,无法稳定完成叠毛巾、拆积木等真实物理任务,理论与实操严重脱节。

此次小米推出的Xiaomi-Robotics-0模型,正是为解决这些行业难题而来。该模型拥有47亿参数规模,兼具视觉语言理解与高性能实时执行能力。在Libero、Calvin、SimplerEnv三大全球主流具身智能测试集里,它对标超过30款主流模型,在所有基准测试中全部斩获SOTA(State-of-the-Art,即当前公开可验证的最先进、最高水平),真正实现了“仿真通、真机强、多模态能力不丢失”的重大突破。

Xiaomi-Robotics-0最具颠覆性的亮点在于,它能在普通消费级显卡上实现实时推理,一举打破了高端机器人模型“只能实验室跑、普通人用不起”的困境,大幅降低了具身智能技术的落地门槛。这意味着普通开发者无需斥巨资购买专业显卡,也能让模型稳定运行,为更多人参与机器人技术研发提供了可能。

小米能够实现这一突破,关键在于自研的Mixture-of-Transformers(MoT)混合架构。这一架构可看作是为机器人打造的“双脑协同系统”,兼顾决策与执行效率。其中,视觉语言大脑(VLM)负责理解人类指令和感知环境,即使面对“把毛巾叠好”这类模糊指令,也能精准把握空间关系和任务目标,保留了多模态理解能力,这是此前许多VLA模型所不具备的优势。动作执行小脑(DiT)则专注于将指令转化为流畅动作,生成连续的“动作块”,并通过流匹配技术确保动作精准稳定,让机器人告别机械卡顿,动作灵活度接近人类,从根源上解决了传统模型动作断层的问题。

为了让机器人既“聪明”又“能干”,小米团队还设计了独特的两阶段训练方案。在第一阶段,通过跨模态预训练,让模型在学习动作的同时,不丢失物体识别、视觉问答等基础能力,避免出现“练了手工、废了脑子”的情况。同时,利用Action Proposal机制使VLM的特征空间与动作空间对齐,为后续实操奠定基础。在第二阶段,通过后训练优化,采用异步推理模式从机制上解决真机“动作断层”问题,搭配Clean Action Prefix让动作轨迹连续不抖动,借助Λ-shape Attention Mask让机器人聚焦当前视觉反馈、摆脱历史惯性,即使环境发生变化,也能即时调整,大幅提升环境适配能力。

从曝光的真机视频中可以直观看到,Xiaomi-Robotics-0模型在处理不同物体时表现出色。面对软塌塌的毛巾,它会先铺平,再对折、整理整齐,对于多余的毛巾还会主动放回原位;面对刚性积木,它能稳妥地一步步拆解,手眼协调极为稳定,不会出现卡顿或失误。无论是软质材料还是硬质物件,都能从容应对,充分展现了物理智能真正落地的成果。

值得一提的是,小米此次展现出了强大的格局,将Xiaomi-Robotics-0成果全量开源。技术主页、GitHub开源代码、Hugging Face模型权重全部公开,全球开发者都能免费使用、进行二次开发,相关资源可在各大平台直接获取。这一举措彻底打破了大厂对具身智能核心技术的垄断,让原本高高在上的具身智能技术真正向行业敞开大门,普通开发者也能参与其中,加速整个行业的技术迭代。

雷军在微博中透露,小米早已在机器人赛道深度布局,目前仍在全球招募顶尖人才,团队还在持续冲刺下一代技术。此次发布的Xiaomi-Robotics-0只是阶段性研究成果,未来或许还会有更多惊喜等待着我们。

北京大学团队突破:全球首个大规模集成光量子芯片通信网络问世
研究团队成功研制出全功能集成的高性能量子密钥发送芯片与光学微腔光频梳光源芯片,并在此基础上构建了全球首个基于集成光量子芯片的大规模量子密钥分发网络——“未名量子芯网”。自2019年起,实验室团队持续投入QK…

2026-02-12

企业邮件系统搭建指南:自建与托管,哪种模式更适合你的企业?
自建邮件系统与托管企业邮箱的区别 托管企业邮箱则是租用第三方服务商提供的企业邮箱服务,按年支付租金的模式。 在数据安全方面,U-Mail自建邮件系统将邮件数据存储在企业内部的服务器上,企业自主维护与保存,有…

2026-02-12

量子力学三大核心:解锁微观世界新视角 引领科技前沿新突破
从电子的双缝干涉到量子计算机的并行计算,其理论框架不仅解释了原子结构、激光原理等基础现象,更催生了量子通信、量子传感等前沿技术。该原理延伸至能量-时间不确定性关系ΔE·Δt≥ħ/2,解释了虚粒子涨落与量子隧穿…

2026-02-12

湖北“智慧工厂”里,“双万兆”赋能机器人高效协同忙生产
在湖北荆州美的洗衣机工厂注塑车间,六臂轮足式人形机器人“美罗”,正熟练地进行润滑操作、钣金上料、3D质检等任务;它的同事“玉兔”AI巡检机器人,则在成排的洗衣机间自如穿梭,执行高效精准的检测工作……临近春节,…

2026-02-12

iPhone 18 Pro系列将搭载自研C2基带 5G卫星通信开启无界互联新体验
【太平洋科技】2月12日消息,有消息称,苹果计划在今年秋季发布的iPhone 18Pro系列上首发自研基带芯片C2,此举标志着高通基带在iPhone上正式退场。 相关报道显示,C2不仅全面支持毫米波与s…

2026-02-12