阿里云峰会重磅发布Qwen3.7-Max，国产大模型性能跃升开启智能体新纪元-产业经济-发现者网

在2026阿里云峰会上，阿里巴巴正式推出新一代千问旗舰大模型Qwen3.7-Max，引发行业高度关注。这款模型在第三方机构Arena全球大模型盲测中表现卓越，不仅超越Kimi-K2.6、DeepSeek-v4-pro等国产模型，更与GPT、Claude、Gemini等国际顶尖模型比肩，稳居国产模型榜首位置。

Qwen3.7-Max的突破性进展体现在多个维度。在编程能力方面，该模型在SWE-Pro、SWE-Multilingual等权威测评中取得领先成绩，Terminal Bench 2.0-Terminus得分达69.7，超越DeepSeek-v4-pro-Max、Claude-Opus4.6等模型。其编程能力覆盖从前端原型开发到复杂多文件工程的全流程，在SWE-bench系列测评和SciCode编程测评中较前代模型实现显著提升，展现出资深工程师级的代码编写与自我纠错能力。

通用智能体性能同样表现亮眼。在MCP-Atlas、MCP-Mark等现实能力测试中，Qwen3.7-Max超越GLM5.1、Kimi-K2.6等模型，创下国产新高。该模型在Kernel Bench L3测试中展现出强大的GPU内核优化能力，在GPQA Diamond、HLE等推理核心测评中均超越Claude-Opus4.6及所有国产模型。多语言能力方面，其在指令遵循IFBench评测中取得79.1分突破性成绩，在WMT24++、MAXIFE等翻译评测中保持领先优势。

最引人注目的是Qwen3.7-Max在长程复杂任务中的自主迭代能力。在平头哥真武M890芯片这一全新硬件平台上，该模型通过持续35小时的自主编程，完成1158次工具调用和432次内核评估，最终实现推理内核10倍加速。测试轨迹显示，模型在运行超30小时后仍能发现优化点，甚至主动发起架构重设计，这种长周期自主迭代能力为AI模型进化开辟了新路径。

在企业级应用场景中，Qwen3.7-Max通过MCP集成和多智能体协作，在SpreadSheetBench-v1办公自动化基准测试中斩获87分。以往需要专业团队耗时1-2周的复杂项目，现在由该模型驱动的智能体可在数小时内完成端到端交付。这种效率提升得益于其跨框架泛化能力，能在Claude Code、OpenClaw、Qwen Code等多种智能体框架下稳定运行。

阿里云同步宣布技术体系全面升级，推出"芯-云-模型-推理"一体化解决方案。Qwen3.7-Max模型API即将登陆阿里云百炼平台，同时将推出具备多模态推理和视觉理解能力的Qwen3.7-Plus等版本，构建覆盖编程智能体与视觉智能体的全能基座，为Agentic时代提供核心技术支持。

苏州5月19日挂牌吴中区两宗宅地起始总价约11.1亿 6月17日竞价截止

2026-05-20

5月20日11时19分南向资金净买入额突破50亿港元大关

2026-05-20

千年瓷都焕新颜：潮玩体验碰撞传统技艺瓷器“手作热”激活文旅新活力

2026-05-20

渣打集团发布新战略：2030年前裁员近8000人，AI驱动银行行业变革提速

2026-05-20

谷歌Android Halo新功能上线：系统级透明化让AI智能体状态实时可见

这项功能在 Google I／O 期间亮相，会在屏幕顶部加入一个较为低调的状态提示，向用户展示 AI 智能体是否正在设备上实时运行。等到该功能在今年晚些时候上线后，Android Halo 还会支持其他 …

2026-05-20

石头科技产品线再升级：从室内清洁到户外割草，未来还将推出爬楼机器人

石头科技产品线扩张现有产品：智能扫地机器人、洗地机。 2026CES：G-Rover轮足式智能扫地机器人，具备自主爬楼功能，突破传统清洁限制。技术投入研发团队：超千人规模，全球五大研发中心。发展战略 …

2026-05-20

深圳后浪订货会：控区控货助力服装业破局，开启线下价值主场新征程

2026-05-20

宝地矿业12.5亿竞拍凯宏投资66%股权获诺尔湖铁矿资源储备增至7.4亿吨

2026-05-20

黄奇帆建言：人民币适度升值+延长带薪假助力出口顺差合理调节

2026-05-20

杭州柯林豪掷3亿控股开普勒人形机器人行业整合大幕或就此拉开

除了杨华以外，汉威科技、乔锋智能、福然德、涛涛车业等上市公司也计划在此次交易中，向杭州柯林出售部分开普勒股权。订单和资源正快速向技术、资本、人才综合实力更强的头部公司汇聚，未来三年，行业可能迎来第一轮淘汰赛…

2026-05-20