小米公司近日宣布,其MiMo-V2.5系列API正式启动永久性降价策略,最高降幅达到99%,且不再根据上下文窗口长度进行差异化定价。这一调整于北京时间5月27日零时起全球同步生效,标志着小米在人工智能服务领域迈出重要一步。新定价体系不仅大幅降低了开发者的使用成本,还通过简化计费规则提升了透明度,为行业树立了新的标杆。
伴随API价格调整,小米同步优化了Token Plan计费体系。用户单次购买后的可用量提升至原有水平的5至8倍,同时计费规则更加直观易懂。为确保现有用户平滑过渡,小米宣布所有仍在有效期内的Token Plan订阅用户(包括通过百万亿Token创造者激励计划及Apache软件基金会专属福利获得权益的用户),其Credits额度将于5月27日零时自动重置,并按照新规则执行。针对历史付费但已过期的用户,小米承诺将在未来一周内公布专属补偿方案。
技术层面的突破是此次价格调整的核心支撑。小米研发团队通过重构推理系统架构,将KV Cache在GPU显存、CPU内存与SSD之间的数据传输量压缩至优化前的1/7,同时使可缓存token数量扩大近5倍。通过改进专家并行计算方案和输入长度动态分桶策略,集群整体输入吞吐能力显著提升。这些技术优化直接降低了单位token的服务成本,为降价策略提供了坚实基础。
行业观察人士指出,小米此次调整不仅体现了其技术实力,更展现了通过规模化效应降低AI使用门槛的决心。永久降价与计费体系优化相结合,将吸引更多开发者及企业用户采用小米的AI服务,尤其在需要处理大量上下文数据的场景中(如智能客服、内容生成等领域),新策略的竞争优势尤为明显。随着技术迭代与生态完善,小米有望在AI服务市场占据更重要的地位。
