发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

人形机器人新突破!WholeBodyVLA框架实现行走操作协同,验证全身控制可行路径

2025-12-18来源:快讯编辑:瑞雪

在具身智能领域,让双足人形机器人像人类一样完成装箱、搬运、推车等移动操作任务,始终是科研人员努力的方向。近期,由香港大学、智元AGIBOT、复旦大学以及上海创智学院组成的联合研究团队,取得了一项重要成果——提出WholeBodyVLA框架,为双足人形机器人的自主全身控制开辟了新路径。

该研究基于智元灵犀X2展开,将视觉语言动作模型(VLA)拓展至双足人形机器人的全身控制范畴,并成功验证了其在全身移动操作任务中的可行性。与原地操作不同,移动操作面临更为复杂的挑战。其难点并非掌握单一技能,而是要求行走与操作在同一任务中长时间、稳定地协同进行。

围绕这一难题,WholeBodyVLA框架总结出制约移动操作发展的两大核心问题:真机数据稀缺以及运动执行过程中的不稳定性。在人形机器人执行移动操作任务时,数据采集的难度和成本远高于原地操作。通常需要多名数采员同时协作,通过遥操让机器人上半身进行操作、下半身完成行走。这一过程往往借助混合方案实现,比如用VR控制上半身、遥控器控制下半身,但这种方式操作流程繁琐、效率低下;若采用全身动捕系统,又会面临高昂的价格。

同时,移动操作对运动精准性和稳定性的要求极高。与单纯的操作相比,任何细微的偏差都可能使目标操作物体脱离相机视野和工作空间。即便VLA输出了正确的运动指令,下半身控制器仍可能出现执行失误,例如走歪、踉跄等情况。

为攻克这些难题,研究团队在WholeBodyVLA框架中引入了两项关键创新。一方面,从人类视频中学习移动与操作的潜在动作。该框架通过第一视角的人类视频学习相关动作,其中操作相关的潜在动作基于AgiBot World数据集进行建模。另一方面,设计了面向移动操作的强化学习(RL)控制器。将通用连续运动控制目标简化为一组离散运动指令,仅保留移动操作必要的强化学习训练目标,从而大幅提升控制器在运动执行时的稳定性。

研究团队在智元灵犀X2人形机器人上开展了大量真机实验。实验结果表明,WholeBodyVLA框架使机器人具备了大范围、长程移动操作任务的能力,在距离、操作和地形等方面都展现出良好的泛化性。

日立2027年前将引入自研人形机器人进厂,承担电子布线安装等复杂作业
日立开发的人形机器人的试制品拥有两只手臂,搭载驱动 AI 的计算机和摄像头,两只手臂上各有两根手指;该机器人没有腿,配备带轮子的转向架。据IT之家此前报道,日本川崎重工于 12 月 3 日公开人形机器人的…

2025-12-18

全球首条!人形机器人“小墨”批量上岗,宁德时代产线智能化升级再提速
【太平洋科技】12 月 18 日消息,据《科创板日报》报道,全球首条实现人形具身智能机器人规模化落地的新能源动力电池 PACK生产线,近日已在宁德时代中州基地正式投入运行。 此次批量上岗的人形机器人名为…

2025-12-18

宁德地区电子邮箱使用指南:从登录到高效管理全解析
用户可以在智能设备上安装这些客户端,通过配置账户信息(包括地址与安全密码)来实现邮件的同步与管理。对于宁德地区的用户而言,通过官方渠道安全登录,并结合自身需求熟练掌握各项功能与设置,是保障通信顺畅与信息安全的…

2025-12-18