小米集团近日在AI领域动作频频,先是宣布对MiMo-V2.5系列API进行永久性价格调整,随后又公布了未来三年在AI领域的巨额投入计划。这一系列举措引发了业界广泛关注。
据了解,小米技术团队对MiMo-V2.5系列API进行了全面优化,新定价体系最高降幅达99%,且不再区分上下文窗口长度。此次调价于北京时间5月27日0时正式生效,全球同步执行。小米技术负责人表示,这一调整得益于团队在推理系统上的持续创新,特别是基于SGLang HiCache完整支持SWA技术,将KV Cache在多级存储间的数据搬运量降低至优化前的近1/7,同时将可缓存token数量提升至近5倍,显著提升了推理效率。
在计费体系方面,小米也进行了重大改革。新的Token Plan采用"加量不加价"策略,用户可用token数量提升至原计划的5-8倍。计费规则更加透明,实现了"所见即所得"的计费模式。特别值得注意的是,所有已订阅Token Plan且仍在有效期的用户,包括参与百万亿Token创造者激励计划的用户,其Credits额度将于5月27日0时全量重置,并按新规则执行。
小米技术团队透露,此次价格调整背后是多项技术突破的支撑。除了存储优化外,团队还通过优化专家并行方案和输入长度分桶策略,显著提升了集群输入吞吐能力。这些改进使得在保障服务质量的前提下,单位token服务成本持续降低。小米表示,后续将发布详细的技术博客,深入解析这些推理优化技术。
在商业表现方面,小米集团一季度业绩亮眼。数据显示,公司实现营收991亿元,经调整净利润61亿元,全球月活跃用户超7.46亿,AIoT平台连接设备数突破11亿。智能电动汽车及AI等创新业务收入达199亿元,当季新车交付80856台,拥有490家汽车销售门店。研发投入方面,小米一季度投入90亿元,同比增长33.4%,研发人员总数达26048人,预计全年研发投入将超过400亿元。
值得关注的是,小米在AI领域的雄心不止于此。公司创始人雷军在微博宣布,未来三年将在AI领域投入600亿元。这一承诺在小米的技术布局中已初见端倪——Xiaomi MiMo-V2.5-Pro模型近期在Artificial Analysis榜单上表现优异,在综合智能指数和Agent指数两项评估中,与全球其他开源模型并列第一。这一成绩彰显了小米在AI基础研究方面的实力,也为公司未来的技术发展奠定了坚实基础。
