霸榜模型揭晓:小米MiMo-V2系列模型正式亮相,专为Agent打造

作者:贾玥      时间: 2026-03-19      浏览数:4791

封面.jpg

分析师/贾玥

校对/Tina
策划/Eason

过去一周,全球大模型开发者社区被两个突然冒出的模型搅动了。代号“Hunter Alpha”和“Healer Alpha”的黑马空降知名模型平台OpenRouter,在没有任何官方宣传的情况下,一路冲上趋势榜第一、周榜第三,日榜持续领先。

整个社区都在猜测:这是DeepSeek的新版本?还是马斯克xAI的暗牌?直到昨天,面纱终于揭开——它们来自小米,是这家手机巨头全新推出的自研大模型家族MiMo-V2系列。

1.png

今天凌晨,小米正式官宣了三款面向Agent(智能体)时代的新模型:旗舰基座MiMo-V2-Pro、全模态模型MiMo-V2-Omni,以及语音合成模型MiMo-V2-TTS。其中,最受关注的MiMo-V2-Pro拥有超过1万亿的总参数量,激活参数控制在420亿,支持高达100万token的上下文长度,是目前国内首个公开宣称达到这一量级的商用大模型。

01
为Agent时代量身打造的模型矩阵

此次小米发布的MiMo-V2系列是一套完整的“组合拳”,包含三个各有侧重的版本:

MiMo-V2-Pro Preview(原Hunter Alpha):面向Agent时代的旗舰基座模型。它拥有惊人的超过1万亿的总参数量(激活参数控制在42B),并支持1M超长上下文。这意味着它能像真正的大脑一样,处理海量信息并驾驭极其复杂的任务流。

MiMo-V2-Omni(原Healer Alpha):全模态理解模型。专为需要快速反应和低延迟的真实场景打造,能够同时处理文本、图像、音频乃至长达一小时的视频输入,是智能体感知世界的“感官”。

MiMo-V2-TTS:首款“说唱兼备”的超拟人语音大模型。由于OpenRouter平台的功能限制,它未能参与此次盲测,但其在语音合成领域的突破同样值得关注。

在权威大模型综合榜单Artificial Analysis上,旗舰机型MiMo-V2-Pro已位列全球第九、国内第三,稳稳跻身行业第一梯队。

2.png

更关键的是,这款模型从设计之初就瞄准了“智能体”这一真实应用场景。在OpenClaw等主流Agent框架的标准评测榜单PinchBench上,MiMo-V2-Pro的表现处于全球顶尖水平。这意味着它能在无人干预的情况下,自主完成复杂的工作流编排、长周期任务规划,以及精准的外部工具调用。

在过去一周的盲测中,很多开发者反馈,在复杂的Agent编排场景里,Hunter Alpha(即MiMo-V2-Pro Preview版)的实际效果已经接近Claude 4.6。

02
能力对标Claude Opus 4.6,价格只有1/5

如果说技术参数是“硬实力”,那么定价策略就是“硬手腕”。

小米给MiMo-V2-Pro定了一个极具冲击力的价格:在256K上下文长度内,输入token单价为每百万1美元,输出为每百万3美元;即使扩展到100万上下文,输入也只需每百万2美元,输出每百万6美元。

这是什么概念?对比行业标杆Claude Opus 4.6,后者类似服务的价格大约是MiMo-V2-Pro的五倍。对于需要大规模调用API的开发者来说,这个价差意味着成本直接打了两折。

“这基本是贴着脸打的‘价格战’。”一位业内相关人士评价,“小米的策略很明确:用接近顶级模型的能力,加上腰斩再腰斩的价格,快速抢占Agent开发者的心智和预算。”

为了加速生态渗透,小米还联合了OpenClaw、OpenCode、KiloCode、Blackbox及Cline五大主流Agent开发框架,向全球开发者提供为期一周的限时免费接口支持。

3.png

目前,MiMo-V2-Pro已经作为底层推理引擎,与金山办公实现了框架级集成。WPS的AI助手“灵犀”可以直接向搭载了MiMo-V2-Pro的“灵犀Claw”提问或布置复杂任务。小米浏览器也已全面接入该模型,提升AI搜索的信息获取效率。

在多模态方面,MiMo-V2-Omni支持文本、图像、音频、视频(最长一小时)的联合输入,在OpenClaw里可以处理网页截图、摄像头画面、音频分析等复杂任务。而MiMo-V2-TTS则展现了强大的语音合成能力,支持多种方言和音色切换,甚至能模仿特定人物的声音特征。

有了这三个模型的组合,小米可以说拥有了现阶段国内最强的Agentic模型套件。它们能覆盖从理解、规划到执行、交互的全链条,这让小米在“人车家全生态”的AI化竞争中拿到关键优势。

03
国内大模型竞争进入“Agent实战”新阶段

小米此次突然杀入大模型赛场,释放了一个明确信号:国内大模型的竞争重点,正在从“对话能力”转向“执行能力”。

过去一年,各家厂商还在比拼谁的中文理解更强、谁的诗词写得更好。但现在,随着OpenClaw等智能体框架的普及,市场对模型的要求变了——能不能写代码、能不能调工具、能不能完成真实工作流,成了新的试金石。

MiMo-V2-Pro的推出,意味着小米选择了一条差异化的路径:不做最会聊天的模型,要做最能“干活”的模型。

“今年小米在AI领域的投入会超过160亿元。”雷军在官宣时透露。这笔钱显然不会只用来训练参数。从与五大框架的合作,到与金山办公的集成,再到限时免费策略,小米正在用最快的速度构建自己的AI生态。

对于开发者来说,多了一个高性价比的选择总是好事。但更值得关注的是,当手机巨头、互联网大厂、创业公司都在同一个赛道里押注“智能体”时,这场竞争的终局会是什么?

或许,答案就藏在小米这次发布的潜台词里:未来的AI,不是用来聊天的,是用来干活的。而能干活的AI,最终会重新定义我们与所有设备、所有服务交互的方式。

从OpenRouter上的霸榜者,到如今全面开放的完整产品矩阵,小米用MiMo-V2系列证明了自己在大模型领域的深厚积累。

随着这些能力逐步渗透到手机、汽车、家居和办公场景中,那个由智能体驱动的未来,正离我们越来越近。


北京第一新声信息咨询有限公司 版权所有(C)2024 京ICP备2024089855号-1

第一新声商务经理 Sherry
Tel:18910717116

第一新声商务经理 Sherry
Tel:18910717116

第一新声研究客服 Kim小严

第一新声编辑客服 Tina

第一新声运营经理 孟小新