发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

国产智谱GLM-5.2正式发布!唐杰:纯开源无限制,挑战长时程任务新高度

2026-06-20来源:快讯编辑:瑞雪

今日,智谱正式发布并开源了其最新旗舰模型GLM-5.2,标志着开源模型在编码能力领域实现重大突破。该模型专为长周期任务设计,首次在稳定的百万级上下文窗口下运行,并通过架构创新显著降低了计算成本,为开发者提供了更高效的工具选择。

GLM-5.2的核心优势在于其百万级上下文处理能力。通过引入IndexShare机制,模型每四层稀疏注意力共享同一索引器,在百万token场景下将单token计算量降低约2.9倍。这一架构改进不仅提升了处理效率,还使模型在长文本任务中保持稳定性,例如代码构建、系统优化等复杂工程场景。技术团队特别强调,该模型在真实工程压力下的可靠性经过大规模训练验证,涵盖自动化研究、性能调优及多轮调试等任务。

基准测试数据显示,GLM-5.2在长周期编码任务中表现优异。在FrontierSWE基准上,其性能仅落后Claude Opus 4.8版本1%,同时超越GPT-5.5及Opus 4.7版本;在PostTrainBench评估中,该模型通过后训练优化小模型的能力排名第二,仅次于Opus 4.8;而在超长任务基准SWE-Marathon上,GLM-5.2虽与Opus 4.8存在13%差距,但仍居开源模型首位。这些成绩表明,开源模型首次在编码能力上达到闭源顶尖模型水平,打破了“开源滞后闭源3-6个月”的行业认知。

开发者社区已迅速展开应用探索。用户反馈显示,基于GLM-5.2开发的硬盘扫描工具可在13分钟内完成缓存整理,而简易版Token检测器仅需2分钟即可生成。更值得关注的是,MiniMax、火山引擎等平台的开发者群组中,涌现出大量利用GLM-5.2 API构建的智能应用,涵盖文档生成、代码纠错及多模态交互等场景。有开发者指出,尽管未购买Coding Plan的5倍加速服务,现有版本已能满足多数需求,预计高速版本将进一步拓展应用边界。

智谱创始人唐杰在发布后撰文阐述技术路线。他强调,GLM-5.2采用MIT开源协议,无地域或技术访问限制,这与其将研发重心转向“思考-编码-智能体”融合的战略密切相关。唐杰认为,单纯提升对话能力已无法满足复杂任务需求,模型需在真实环境中持续执行并处理失败案例。为此,团队通过改进MTP解码架构,将推理吞吐量提升3倍,同时降低40%-60%的token消耗,这些优化直接体现在小米MiMo Claw等商业产品的集成中。

行业观察指出,GLM-5.2的发布正值大模型应用转型关键期。随着SpaceX收购Cursor母公司、小米推出云端智能体工具等事件发生,Agent Coding成本持续攀升已成为趋势。唐杰透露,智谱下一步将聚焦提升token缓存效率与反馈速度,通过优化智能体决策链路,进一步缩小与闭源模型的差距。这一方向与DeepSeek创始人梁文锋此前的判断形成呼应——后者曾预言数学、代码及多模态将成为AGI核心路径,尽管DeepSeek当前更侧重融资扩张,但行业对技术融合的探索已不可逆转。

基于宇树G1改装的人形机器人 Pemba 登顶火山,未来将挑战珠峰
配备摄像头、传感器、卫星通信和机载 AI 后,人形机器人可以自主巡查大范围区域,并持续收集环境数据。按照设想,Pemba 将在珠峰大本营和海拔近8000 米的四号营地之间活动,收集电池性能、行走能力、关节受…

2026-06-20

AI产业告别资本泡沫:从概念炒作到务实深耕,细分场景成发展新引擎
但经过市场一轮筛选与冷却,如今的 AI 赛道早已褪去资本泡沫,行业共识从 “做大模型” 转向 “用好 AI”,务实落地成为评判技术价值的唯一标准。制造、文旅、政务、零售等细分领域,不再盲目接入全能通用大模型,…

2026-06-19

智谱唐杰对话马斯克:国产大模型追赶Fable 5 进度提速,年内或有新突破
他先给智谱的GLM-5.2定了个位,认为 它现在大概是Claude Opus 4.7-4.8的水平。 但笔者认为,要想实现追赶 Fable5 的目标,国产模型不仅要在预训练阶段把模型推向万亿级参数,更大的挑…

2026-06-19

首台容错量子计算机2028年或问世,量子计算实用化迈出关键一步
量子计算最大的障碍拥有上万量子比特的机器瞄准“百万量子操作”时代从科学问题转向工程问题2028年能否实现,仍不确定即便成功,问题仍然存在或将首先成为“发现机器” 量子计算公司“量子时代”(QuEra)近日给…

2026-06-19