发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

通义千问团队发布Qwen-AgentWorld:原生语言世界模型开启智能体交互新篇章

2026-06-24来源:快讯编辑:瑞雪

阿里通义千问团队近日宣布推出全球首个原生语言世界模型Qwen-AgentWorld,该模型通过模拟七大领域的智能体交互环境,在复杂任务处理能力上实现突破性进展。基于超过一千万条真实交互轨迹数据,模型采用CPT→SFT→RL三阶段训练架构,在全新发布的AgentWorldBench评测基准中超越GPT-5.4、Claude Opus 4.8等国际顶尖模型,成为智能体训练领域的重要里程碑。

该模型突破性地将环境建模融入训练全流程,形成原生世界建模范式。在CPT阶段通过交互轨迹学习环境知识,引入信息论损失掩码技术精准识别关键对话轮次;SFT阶段创新性地激活思维链推理模式进行状态预测;RL阶段则采用混合奖励信号优化输出质量。这种训练架构使模型在Web、OS、Android等GUI领域实现纯文本建模替代视觉渲染,通过可渲染代码直接呈现环境观测数据。

评测数据显示,3970亿参数版本的Qwen-AgentWorld在七大领域综合得分58.71,较GPT-5.4高出0.46分,尤其在Terminal和SWE领域展现显著优势。350亿参数版本通过三阶段训练实现8.66分的性能跃升,成功超越Claude Sonnet 4.6等同等规模模型。所有测试样本均配备真实环境执行的ground-truth数据,确保评测结果的可靠性。

研究团队提出两种互补的世界建模应用模式:作为解耦环境模拟器时,可为强化学习提供可控的虚拟训练场,其塑造智能体行为的能力远超真实环境训练;作为统一基础模型时,预热训练后的模型可直接迁移至多轮任务场景,无需额外微调即可保持优异性能。目前模型架构与评测基准已在Hugging Face和ModelScope平台开源,为全球研究者提供完整的技术框架与评估工具。

英伟达发布Halos系统:为具身智能机器人打造全栈安全“基石”
Halos最大的特点,是把英伟达过去在自动驾驶领域超过18600工程人年的安全积累和700万行经过验证的代码,搬到了机器人赛道,为自主机器人提供统一的安全架构。英伟达在这一层拿出了IGX Thor,一颗面…

2026-06-24

石头科技2026年再获新专利,智能升降系统引领清洁机器人新突破
这项创新技术不仅优化了机械结构与智能控制系统的协同设计,还实现了清洁机器人检测组件的动态升降功能,大大提升了设备在复杂环境中的避障精度与清洁覆盖率。这一数字不仅反映了公司在技术研发上的坚定决心,也为其带来了丰…

2026-06-24

AI推理赛道再掀热潮!Baseten获101亿融资,估值飙升至880亿
Baseten帮助企业客户部署和运行开源或自主定制的AI模型,提供GPU调度、自动扩缩容、可观测性和计费等全套系统软件,相当于AI推理阶段的基础设施层。推动这一增长的核心逻辑是,开源AI模型的性能正在逼近闭源…

2026-06-24

亚马逊云科技储瑞松:模型能力与工程体系共促Agentic AI爆发拐点到来
这背后,是模型能力的不断提升和Agentic工程体系的日益成熟,两者形成了一个相互促进的飞轮。储瑞松表示,Agentic工程体系是把模型能力转化为可以稳定交付业务结果的智能体的体系化的工程能力。 最后,储瑞…

2026-06-24