发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

小米凌晨官宣重磅成果!三大自研MiMo-V2系列模型上线赋能Agent时代

2026-03-19来源:快讯编辑:瑞雪

小米技术官方近日宣布,正式推出三大自研MiMo-V2系列模型,涵盖旗舰Pro、全模态基座Omni以及语音合成TTS,为智能交互领域带来突破性进展。此次发布标志着小米在多模态大模型领域的技术积累进入新阶段,为Agent时代的智能化应用提供了核心支撑。

其中,Xiaomi MiMo-V2-TTS语音合成模型以全模态交互为核心设计目标,通过自主研发的Audio Tokenizer技术及多码本语音-文本联合建模架构,实现了对语音风格的精细化控制。该模型不仅支持从整体语调到局部情绪的逐层调节,还能精准还原人类说话的自然节奏,甚至在歌唱场景中也能准确捕捉音高变化与节奏韵律,展现出接近真实人类的语音表现力。这一突破为智能客服、有声内容生成等领域提供了更自然的交互解决方案。

面向复杂Agent应用场景,小米同步推出全模态基座模型Xiaomi MiMo-V2-Omni。该模型整合了文本、视觉、语音的多模态感知能力,并内置工具调用、函数执行及图形界面操作等行动模块,可无缝适配各类Agent开发框架。在匿名测试阶段,Omni模型凭借其强大的跨模态推理能力,在OpenRouter平台的日均调用量突破百万次,并在OpenClaw测评榜单中以综合得分第一的成绩领先同类模型。其低门槛接入特性显著降低了全模态Agent的开发成本,加速了智能化应用的落地进程。

针对高负载Agent工作场景,小米发布的旗舰基座模型Xiaomi MiMo-V2-Pro展现出更强性能。该模型参数量超过1万亿,支持100万 tokens的超长上下文处理,通过参数规模与算力的协同优化,实现了从代码生成到复杂任务执行的广泛能力覆盖。在全球权威大模型评测中,Pro模型以综合智能排名全球第八、国内第二的成绩,验证了其在长文本理解、逻辑推理等关键维度的技术优势。目前,Omni与Pro模型已开放API服务,并与多家主流Agent开发平台达成合作,为全球开发者提供限时免费的接口支持。

从轻量化到模块化:AI智能眼镜如何突破同质化困局迈向新未来
针对这一现象,第一财经在AWE2026期间邀约访谈了AI+AR行业专家、轻量化智能AR眼镜品类开创者王勇。不同于目前AI音频眼镜的镜腿拆卸方案,玄景推出的模块化AI智能眼镜方案是“AI拍摄眼镜+mini …

2026-03-19

6G冲刺倒计时三年:华为高通英伟达混战,谁能锁定未来生态位?
这里面的商业账很好算:对运营商来说,如果现在部署支持U6GHz的5G-A设备,等到2029年6G标准冻结后,只需要做个软件升级就能接入6G网络,硬件不用动,前期的投资就保住了。不管6G基站是谁建的,只要终端…

2026-03-19

十年前知乎上的“脑洞”问答,如今竟一一照进现实!
只不过 AI 不是 “ 藏得很好”,而是在过去这十年里,疯狂消化着人类的知识库,最后在大家都还没完全反应过来的时候,突然闯进了咱们每个人的日常生活。 就像今天的智驾,虽然还没达到能够让你在车里安心睡觉的程…

2026-03-19

百度推出“虾”系列新品及多领域解决方案,构建智能生态引领行业新趋势
在开发工具方面,百度的秒哒团队推出了“MiaodaAppBuilder”技能包,这一被称为OpenClaw的应用开发技能,不仅引发了行业的高度关注,还将专业级应用开发能力转化为标准化模块。 市场分析人士指出…

2026-03-19