发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

雷军宣布小米开源具身智能VLA模型Xiaomi-Robotics-0,性能领先且动作连贯灵敏

2026-02-12来源:快讯编辑:瑞雪

小米机器人团队近日宣布,正式开源其最新研发的具身智能VLA模型——Xiaomi-Robotics-0。该模型以47亿参数的规模,结合MoT混合架构,通过多模态VLM大模型作为基础,并嵌入多层DiT结构,实现了通用理解与精细控制的双重突破。

在性能测试中,Xiaomi-Robotics-0展现出显著优势。该模型在Libero、Calvin和SimplerEnv等主流测试集上,与30种同类模型对比后,均取得当前最优成绩。更值得关注的是,其消费级硬件即可支持实时推理,为机器人技术的大规模应用提供了可能。

针对传统VLA模型普遍存在的推理延迟问题,研发团队创新性地采用异步推理模式与Λ-shape Attention Mask机制。这一设计有效解决了“动作断层”现象,使机器人在执行积木拆解、叠毛巾等复杂任务时,能够保持动作连贯性并快速响应环境变化。实验数据显示,该模型在真实场景中的手眼协调能力显著提升。

技术架构方面,Xiaomi-Robotics-0通过跨模态预训练框架,在保留物体检测、视觉问答等基础能力的同时,实现了多模态信息的深度融合。这种设计既保证了模型对复杂指令的理解能力,又通过分层控制机制确保了动作执行的精准度,为具身智能的落地应用开辟了新路径。

科大讯飞星火X2大模型发布:算力自主场景适配,引领行业新方向
科大讯飞相关负责人对《证券日报》记者表示,星火X2大模型实现了通用能力的全面升级,同时将更加专注于教育、医疗、汽车、智能体等高专业性、高体验性场景,致力于在多领域提供领先、可靠的技术方案与支撑。 相较于同类…

2026-02-12