发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

小米凌晨官宣三大自研MiMo-V2模型 赋能Agent时代创新发展

2026-03-19来源:天脉网编辑:瑞雪

小米技术团队近日正式推出三大自研MiMo-V2系列模型,涵盖语音合成、全模态交互及高强度Agent应用场景,为人工智能领域注入创新动能。此次发布的模型矩阵包括旗舰基座模型MiMo-V2-Pro、全模态基座模型MiMo-V2-Omni以及语音合成大模型MiMo-V2-TTS,标志着小米在多模态大模型研发领域取得突破性进展。

作为面向高强度Agent工作场景的旗舰模型,MiMo-V2-Pro以超1T的总参数量和1M超长上下文处理能力脱颖而出。该模型通过参数规模与算力的协同优化,实现了从代码生成到复杂任务执行的广泛能力覆盖。在国际权威评测中,该模型以综合智能评分位列全球第八、国内第二,其强大的泛化能力已通过多项基准测试验证。目前该模型已开放API接口,为开发者提供高精度、长序列的智能支持。

针对全模态交互需求,MiMo-V2-Omni创新性融合文本、视觉、语音三模态感知与行动能力。该模型原生支持多模态推理、工具调用及GUI操作,可无缝适配各类Agent开发框架。在匿名测试阶段,该模型在OpenRouter平台的日均调用量突破百万次,并在OpenClaw测评中以显著优势登顶均分榜首。其低门槛接入特性正加速推动全模态Agent技术的商业化落地。

在语音合成领域,MiMo-V2-TTS通过自研Audio Tokenizer技术实现革命性突破。该模型采用多码本语音-文本联合建模架构,支持从整体语调到局部情绪的精细调控,能够精准还原人类说话的呼吸节奏与情感变化。实验数据显示,其生成的语音在自然度评分上超越主流模型17%,尤其在歌唱场景中可准确匹配音高与节奏,为虚拟数字人、有声内容创作等领域提供高质量语音解决方案。

据小米技术团队透露,MiMo-V2-Omni与MiMo-V2-Pro的API服务已正式上线,并与多家主流Agent开发平台达成战略合作。即日起至年底,全球开发者可通过限时免费接口调用模型能力,相关文档与开发工具包已同步开放下载。此次模型矩阵的发布,标志着小米在AI基础设施领域完成关键布局,为智能体时代的生态建设奠定技术基础。

从轻量化到模块化:AI智能眼镜如何突破同质化困局迈向新未来
针对这一现象,第一财经在AWE2026期间邀约访谈了AI+AR行业专家、轻量化智能AR眼镜品类开创者王勇。不同于目前AI音频眼镜的镜腿拆卸方案,玄景推出的模块化AI智能眼镜方案是“AI拍摄眼镜+mini …

2026-03-19

6G冲刺倒计时三年:华为高通英伟达混战,谁能锁定未来生态位?
这里面的商业账很好算:对运营商来说,如果现在部署支持U6GHz的5G-A设备,等到2029年6G标准冻结后,只需要做个软件升级就能接入6G网络,硬件不用动,前期的投资就保住了。不管6G基站是谁建的,只要终端…

2026-03-19

十年前知乎上的“脑洞”问答,如今竟一一照进现实!
只不过 AI 不是 “ 藏得很好”,而是在过去这十年里,疯狂消化着人类的知识库,最后在大家都还没完全反应过来的时候,突然闯进了咱们每个人的日常生活。 就像今天的智驾,虽然还没达到能够让你在车里安心睡觉的程…

2026-03-19

百度推出“虾”系列新品及多领域解决方案,构建智能生态引领行业新趋势
在开发工具方面,百度的秒哒团队推出了“MiaodaAppBuilder”技能包,这一被称为OpenClaw的应用开发技能,不仅引发了行业的高度关注,还将专业级应用开发能力转化为标准化模块。 市场分析人士指出…

2026-03-19