阿里正式推出新一代大语言模型Qwen3.6-Plus,作为Qwen3.6系列的首款产品,该模型在编程能力、智能体构建和工具调用方面实现显著提升,并支持100万上下文窗口的默认配置。这一模型已适配主流智能体框架,包括OpenClaw、Qwen Code等工具链,为开发者提供更灵活的集成方案。
在编程能力测试中,Qwen3.6-Plus在SWE-bench Verified、Terminal-Bench 2等基准测试中超越GLM-5和Kimi K2.5,但部分指标仍落后于Claude Opus 4.5。实测显示,该模型可在8分钟内完成AI眼镜独立站开发,消耗2.5万token,成本约0.15元。生成的网页设计规避了传统AI风格,但在字体选择上仍显保守。
多模态能力方面,Qwen3.6-Plus重点优化了推理与指令实用性。在北京地铁路径规划测试中,模型成功规划大兴机场至首都机场的最优路线,与高德地图结果一致。当模拟某线路因极端天气停运时,模型虽给出换乘建议,但存在昌平线与19号线换乘时间错误的技术瑕疵。
该模型还展示了视觉编程能力,可根据界面截图或设计稿自动生成前端代码。在《潜水员戴夫》游戏开发测试中,模型拒绝直接生成可执行文件,但提供了包含美术设计、开发指南和基础代码的完整方案。通过API调用时,模型设计了森林主题模拟经营游戏,但可玩性仍需迭代优化。
Qwen3.6-Plus的API已开放调用,输入/输出token价格分别为4元/百万和12元/百万,当前享受五折优惠。新引入的"preserve_thinking"功能可保留多轮对话的思维链,特别适用于智能体任务。企业级应用"悟空"已第一时间接入该模型,阿里云百炼平台同步上线相关服务。
据研发团队透露,Qwen3.6系列后续将开源更小规模版本,并推出性能更强的旗舰模型Qwen3.6-Max。自Qwen3.5发布以来,团队已将主力模型全面转向原生多模态架构,致力于构建能在真实环境中持续感知、推理和行动的智能体系统。