发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

MiniMax启动上市辅导又推M3大模型,自研架构助力性能与性价比双提升

2026-06-02来源:快讯编辑:瑞雪

上海科技企业MiniMax近日成为行业焦点,这家同时已在港交所上市、且不久前启动A股上市辅导的公司,于6月1日正式推出新一代通用大模型MiniMax M3。该模型以解决长文档处理、复杂代码推理等场景中的效率痛点为目标,成为国内首个同时具备超长上下文、原生多模态与前沿编程能力的"三合一"模型。

在核心能力构建上,M3展现出显著技术突破。其100万token的上下文窗口容量可容纳两部中文长篇小说,通过自研的稀疏注意力架构MSA(MiniMax Sparse Attention),将长文本处理成本降低至传统模型的二十分之一。这种技术架构创新使模型在处理法律文书、科研论文等长文本时,能保持更完整的信息链路,同时支持多轮任务协作与复杂代码仓库管理。

多模态能力成为M3的显著优势。不同于传统模型后期叠加视觉功能的开发路径,该模型从训练阶段就实现文字、图像、视频的混合训练,形成原生多模态处理能力。在编程能力评测中,M3在SWE-Bench Pro基准测试中超越GPT-5.5与Gemini 3.1Pro,与Anthropic公司4月发布的Claude Opus 4.7形成直接竞争态势。尽管尚未在综合性能上实现全面超越,但其开源策略与成本优势已引发行业关注。

全球大模型竞争已进入深水区,智能体任务复杂度提升带来的技术挑战愈发凸显。行业观察指出,当Agent需要处理跨领域、长周期任务时,模型的长上下文记忆能力、稳定推理性能与成本控制成为关键竞争要素。M3通过MSA架构实现的百万级上下文窗口,配合显著降低的计算成本,为复杂任务处理提供了新的技术路径。

这家上海企业的研发节奏持续加快。自2023年6月发布M1模型后,公司保持每季度迭代新版本的频率,相继推出M2、M2.1及今年2月的M2.5模型。此次M3的发布,不仅延续了高频迭代策略,更在核心技术指标上实现跨越式发展。其自研的稀疏注意力架构已形成技术壁垒,为后续模型升级奠定基础。

武汉发力“AI+软件”融合:2026年多项目标明确 产业规模迈向新台阶
武汉将依托AI全方位赋能软件产业,从产品、研发、管理三方面推进产业智能化转型。未来,武汉将进一步以“智能化”为引擎,推动软件产品和软件企业AI化转型;以“开源化”为重点推动全市软件产业发展迈上新台阶,力争“十…

2026-06-02

星海图G0.5架构创新引领潮流,七大评测基准全面领跑具身智能领域
G0.5 的选择是彻底去掉这道瓶颈,让同一套模型权重、在同一条自回归序列里,同时完成推理和动作生成。 G0.5 在 R1 Lite 上零样本执行「把毛巾放进洗手池」:在同一自回归流中,模型先生成思考(子任务…

2026-06-02

阿里云Qwen3.7-Plus正式上线:多模态能力升级,跻身全球榜单前列
6月2日,阿里云宣布千问 3.7 系列最新多模态大模型Qwen3.7-Plus正式上线,已上架千问云和阿里云百炼,支持 API 调用。该模型文本、视觉能力全面提升,在权威榜单 Vision Arena 中跻…

2026-06-02

工厂自动化改造:RS485与工业以太网如何抉择?共存方案还是全面替代?
新建项目或大规模产线改造,没有历史包袱,从一开始按工业以太网规划,长期维护成本更低;现有RS485网络节点数量多、轮询周期过长,已经成为生产效率的瓶颈;业务上有设备数据实时上云、远程运维、数字孪生等需求,需…

2026-06-02