近日,人工智能领域迎来重要进展,智谱公司正式发布其最新一代基础模型GLM-5。这款拥有744B参数(40B激活)的模型,规模达到前代GLM-4.5的两倍以上,在Artificial Analysis全球榜单中位列第四,同时摘得开源模型桂冠。技术报告显示,GLM-5的预训练数据量从23T扩展至28.5T,印证了规模化仍是提升AGI效能的核心路径。
在编程能力方面,GLM-5展现出显著突破。该模型在SWE-bench-Verified和Terminal Bench 2.0基准测试中分别取得77.8和56.2的开源模型最高分,性能超越Gemini 3 Pro,并与Claude Opus 4.5形成直接对标。架构创新上,模型引入DeepSeek的DSA稀疏注意力机制,在保持上下文容量的同时降低30%部署成本。资本市场对此反应积极,发布当日智谱股价单日涨幅达26%,周累计涨幅近70%,市值突破1756亿港币。
实测环节验证了GLM-5的逻辑推理能力。面对"100米距离选择开车还是步行洗车"的经典陷阱题,模型精准指出核心矛盾:"需要清洗的是车辆而非人体",并创造性提出"驾车前往后步行返家,洗车完成后再取车"的优化方案。在处理"父母能否结婚"的模糊问题时,模型自动拆解出"未婚父母"与"已婚父母"两种场景,准确识别出常规语境下的逻辑悖论。更令人印象深刻的是,当被问及"亲生父母结婚未通知自己"的情绪困扰时,模型瞬间切换至心理咨询模式,同时敏锐捕捉到时间维度上的根本矛盾——新生儿不可能参与父母婚礼。
开发者社区的实战测试进一步印证模型实力。某开发者使用OpenClaw Agent进行SwiftUI编程对比,GLM-5在界面布局与交互逻辑实现上优于Minimax M2.1。另一组3D网页开发测试中,GLM-5与Opus 4.6展现出不同设计风格,但前者在工程实现完整性上获得更高评价。这些案例表明,模型已具备从代码生成向系统级工程能力跃迁的潜质。
技术适配层面,GLM-5完成与华为昇腾、摩尔线程、寒武纪等七家国产算力平台的深度优化,通过底层算子重构实现硬件加速,在国产芯片集群上达成高吞吐、低延迟的稳定运行。服务模式上,智谱调整GLM Coding Plan套餐价格,最低涨幅30%,同时开放Hugging Face和魔搭社区的模型权重下载,支持Claude Code与OpenClaw生态兼容,普通用户可通过Z.ai平台免费体验。
针对专业开发场景,智谱推出Z Code智能体开发环境。该系统可自动拆解用户需求,调度多智能体并行完成代码编写、命令执行、调试预览等全流程开发,甚至支持手机端远程操控桌面Agent。值得关注的是,Z Code平台本身即由GLM系列模型参与构建,形成技术闭环。在文档处理领域,GLM-5突破传统文本生成边界,可直接输出Word、PDF、Excel等格式文件,在Vending Bench 2模拟经营测试中取得4432美元账户余额,展现出色的长期规划能力。
技术革新背后是算法框架的突破。智谱研发的"Slime"强化学习架构支持更大规模模型训练,配合异步智能体强化学习算法,使模型能够从长序列交互中持续学习。这种设计显著提升了复杂任务执行效率,在BrowseComp联网检索、MCP-Atlas工具调用等专项测试中均刷新开源模型纪录。随着工程化能力成为竞争焦点,大模型正从辅助开发工具向独立承担完整工程环节的方向演进。

