发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

蚂蚁集团发布万亿参数思考模型Ring-2.5-1T 长文本生成与推理能力再上新台阶

2026-02-13来源:互联网编辑:瑞雪

蚂蚁集团近日宣布开源全球首个采用混合线性架构的万亿参数思考模型——Ring-2.5-1T。该模型在长文本生成、数学推理及智能体任务执行等复杂场景中展现出开源领域的领先优势,为智能体时代的高性能任务处理提供了重要技术支撑。其突破性成果不仅体现在参数规模与架构创新上,更通过多项权威测试验证了实际应用价值。

在核心性能方面,Ring-2.5-1T通过优化注意力机制显著提升了长序列推理效率。相较于前代模型,其在32K以上长文本生成场景中访存规模降低超10倍,生成吞吐量提升3倍以上。模型激活参数从510亿扩展至630亿,但得益于混合线性架构的支撑,推理效率不降反升。对比仅拥有320亿激活参数的KIMI K2架构,Ring-2.5-1T在1万亿总参数量下仍保持显著吞吐优势,且随着生成长度增加,效率差距持续扩大。

数学推理能力成为该模型的重要亮点。在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测中,Ring-2.5-1T分别达到35分和105分的金牌标准。在深度思考模式下,该模型在IMOAnswerBench、HMMT-25等数学竞赛推理基准测试中超越DeepSeek-v3.2-Thinking、GPT-5.2-thinking-high等主流开源与闭源模型,同时在LiveCodeBench-v6代码生成基准中展现跨任务泛化能力。

智能体框架适配性方面,Ring-2.5-1T支持Claude Code等主流智能体框架及OpenClaw个人AI助理,可实现多步规划与工具调用。在逻辑推理、代码生成等高难度场景中,该模型与Kimi-K2.5-Thinking、Gemini-3.0-Pro-preview-thinking-high等竞品对比时,仍保持开源领域的领先地位。其设计目标直指当前AI应用从短对话向长文档处理、跨文件代码理解等场景扩展的需求,有效缓解了长输出场景下的计算开销与推理延迟问题。

技术实现层面,Ring-2.5-1T基于Ling 2.5架构构建,通过创新混合线性注意力机制平衡了模型规模与推理效率。蚂蚁百灵团队在模型训练过程中,同步优化了大规模训练基础设施、算法设计与工程落地能力,确保万亿参数模型的可扩展性与稳定性。目前,该模型的权重文件与推理代码已在Hugging Face、ModelScope等开源平台开放下载,官方交互体验页面与API服务计划于近期上线。

星动纪元陈建宇展望2026:具身智能将迎规模化落地,凭实力“出圈”
星动纪元自研了ERA-42端到端VLA具身大模型,实现了对全尺寸双足人形机器人全身及五指灵巧手的精准控制,成为全球仅有的四家能做到这一点的公司之一;另一方面,星动纪元总订单额突破5亿元,物流行业最大单笔订单近…

2026-02-13

欧洲阿丽亚娜6型火箭成功发射 32颗亚马逊低轨卫星顺利入轨
据阿丽亚娜集团官网介绍,这次任务编号为VA267,是该公司与亚马逊低地轨道卫星计划签订的18次阿丽亚娜6型火箭发射计划中的首次任务。 阿丽亚娜集团首席执行官马丁·西翁说,这次成功发射是阿丽亚娜6型火箭四个助…

2026-02-13