发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

雷军官宣:小米MiMo-V2.5系列API永久降价,最高降幅达99%

2026-05-27来源:天脉网编辑:瑞雪

小米集团近日在AI领域动作频频,不仅对核心模型服务价格进行重大调整,更宣布未来三年将投入600亿元深化AI研发。5月27日零时起,小米MiMo-V2.5系列API开启全球同步降价,最高降幅达99%,同时取消上下文窗口长度区分,标志着该模型正式进入普惠化应用阶段。

据小米技术团队披露,此次价格体系重构得益于底层技术的突破性进展。通过SGLang HiCache架构对滑动窗口注意力机制(SWA)的完整支持,模型在GPU显存、CPU内存及SSD间的数据搬运量缩减至原先的1/7,可缓存token数量则提升至近5倍。这种多级存储优化显著提高了缓存命中率,配合专家并行方案与输入长度分桶策略的升级,使集群输入吞吐能力得到质的飞跃,最终实现单位token服务成本持续下降。

伴随价格调整的还有Token Plan计费体系的全面优化。新方案在保持原价不变的前提下,将用户可用token量提升至原计划的5-8倍,特别在Agent开发与代码生成场景下提供更充裕的资源支持。计费规则也更为透明化,采用"所见即所得"模式消除复杂计算环节。所有在有效期内的订阅用户(包括百万亿Token激励计划参与者及Apache基金会专属用户)的额度将于5月27日零时自动重置,并按新标准执行。

集团创始人雷军在同步披露的财报中揭示了AI战略的财务支撑:2024年一季度研发投入达90亿元,同比增长33.4%,研发团队规模突破2.6万人。尽管智能电动汽车等创新业务当季收入199亿元,新车交付量达80,856台,但集团仍坚持将全年研发投入预期上调至400亿元以上。值得关注的是,小米MiMo-V2.5-Pro模型近期在Artificial Analysis评测中,与全球顶级开源模型并列取得综合智能指数与Agent指数双料第一,为持续加码AI领域注入强心剂。

此次技术升级与商业策略的双重调整,展现出小米在AI商业化道路上的独特路径。通过降低模型使用门槛吸引更广泛开发者生态,同时以持续技术投入巩固模型性能优势,形成"普惠化应用-数据反馈-技术迭代"的良性循环。据内部人士透露,团队将于近期发布详细技术白皮书,深度解析推理系统优化背后的工程突破。