发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

星海图G0.5架构创新引领潮流,七大评测基准全面领跑具身智能领域

2026-06-02来源:快讯编辑:瑞雪

北京的具身智能领域迎来重要突破——星海图(Galaxea)正式发布新一代通用视觉-语言-动作模型G0.5,在横跨仿真、真机、零样本、长程任务的7项核心基准测试中全面超越同期竞争对手,尤其在零样本迁移和复杂操作任务中展现出显著优势。这一成果标志着中国团队在具身智能架构创新领域迈出关键一步。

在真实机器人操作数据集DROID的测试中,G0.5未经任何微调直接部署于10项桌面任务,平均成功率达82.5%,较前代模型提升25个百分点。面对需要多步骤顺序执行的"将积木放入抽屉并关闭"任务,G0.5在半数试验中成功完成,而对比模型MolmoAct2则完全失败。这种零样本能力直接反映模型在预训练阶段沉淀的可迁移操作先验,而非针对特定平台的过拟合优化。

在星海图自研平台进行的真实机器人微调测试中,G0.5与两个主流模型使用相同训练数据和计算资源,完成折叠毛巾、整理铅笔盒等6项复杂任务。结果显示其平均成功率达76.7%,较π0.5提升23个百分点,较GR00T-N1.7高出逾一倍。特别在折叠毛巾任务中,模型需协调双臂完成展开、铺平、折叠等精细操作,任何抓握力度偏差都会导致任务失败,G0.5在此类高精度任务中展现出显著优势。

仿真测试环节覆盖单臂指令跟随、双臂协调操作和跨数据集迁移三大场景。G0.5在LIBERO基准测试中以98.9%的成绩刷新纪录,在长程序列任务子集LIBERO-Long中更取得98.6%的突破性表现。双臂协调测试RoboTwin 2.0包含50余个复杂任务,G0.5以93.3%的平均成绩再次领跑。跨数据集迁移测试SimplerEnv-Bridge中,模型同样以87.3%的成绩超越所有对比模型。

最引人注目的是长程移动操作测试BEHAVIOR-1K。该测试包含50个完整家庭场景任务,单次演示平均时长6.6分钟,机器人需在房间尺度空间内完成导航、取物、使用电器等连续操作。G0.5仅用单个预训练模型经过1个训练周期,便取得0.2904的任务成功率,不仅超越前代模型训练4个周期的成绩,更胜过使用4个模型集成的赛事冠军方案。当训练周期增加至4个时,其成功率进一步提升至0.3136,在50个任务中有29个表现优于对比模型。

这些突破性成果源于星海图对现有架构的根本性革新。传统VLA模型采用"视觉-语言模型作为编码器"的架构,将预训练VLM的输出作为条件信号传递给独立训练的动作生成模块。这种设计虽具效率优势,但导致VLM的核心能力经过压缩瓶颈后间接影响动作生成。G0.5则彻底摒弃这种分离架构,让同一套模型权重在自回归序列中同步完成推理和动作生成,使推理真正成为动作的组成部分。

为实现这种统一架构,研发团队引入三项关键技术:跨本体动作编解码器将18种机器人本体数据统一映射到27维动作空间,通过稀疏预测机制仅生成当前需要移动部件的token;原生思维链机制要求模型在生成动作前先输出原子子任务、目标边界框等推理token,这些token与动作token受同一损失函数约束;视觉记忆模块通过分解的时空注意力机制,将多秒历史帧视觉信息轻量级融入当前决策,特别适用于需要反复穿越空间的长程任务。

这种架构创新带来前所未有的控制灵活性。通过改写自然语言提示,用户可直接调整机器人动作风格和执行细节,无需重新训练模型。在"面包放入空气炸锅"任务中,将简单指令改写为"轻轻地把门完全打开"等详细描述后,任务成功率在原有基础上再提升15个百分点。这种能力源于自回归架构中推理token与动作token共享上下文,使动作生成可直接回看完整推理过程。

G0.5的突破得益于星海图"整机+智能"的全栈研发体系。公司自研的R1 Pro和R1 Lite轮式双臂机器人平台已服务全球近百家顶尖机构,其采集的本体数据直接助力模型预训练。基于Qwen3.5 2B视觉-语言模型初始化的G0.5,在预训练阶段联合训练约1亿条视觉-语言问答数据,其中包含5000万条具身场景VQA数据。这种数据与算法的闭环优化,使模型泛化能力与本体适配成本形成良性互动。

值得关注的是,星海图团队此前发布的Fast-WAM论文提出类似架构判断:在动作建模中,训练阶段学到的世界表征比推理时生成的预测帧更重要。两篇工作共同指向一个趋势——中国团队正在具身智能底层架构领域形成原创性判断,这种创新或将重新定义技术发展路径。

阿里云Qwen3.7-Plus正式上线:多模态能力升级,跻身全球榜单前列
6月2日,阿里云宣布千问 3.7 系列最新多模态大模型Qwen3.7-Plus正式上线,已上架千问云和阿里云百炼,支持 API 调用。该模型文本、视觉能力全面提升,在权威榜单 Vision Arena 中跻…

2026-06-02

工厂自动化改造:RS485与工业以太网如何抉择?共存方案还是全面替代?
新建项目或大规模产线改造,没有历史包袱,从一开始按工业以太网规划,长期维护成本更低;现有RS485网络节点数量多、轮询周期过长,已经成为生产效率的瓶颈;业务上有设备数据实时上云、远程运维、数字孪生等需求,需…

2026-06-02

河流湖泊浮标水质监测站:数据传输模块网络绑定全流程指南
水域环境信号多变、设备长期露天运行,若网络绑定配置不规范,容易出现入网失败、频繁断连、数据丢包等问题,造成水质监测数据中断、远程管控失效。常态化做好网络运维与参数核验,能够持续保障河湖浮标监测数据实时、完整上…

2026-06-02