霸榜模型揭晓：小米MiMo-V2系列模型正式亮相，专为Agent打造_企业/人物深度

封面.jpg

分析师/贾玥

校对/Tina

策划/Eason

过去一周，全球大模型开发者社区被两个突然冒出的模型搅动了。代号“Hunter Alpha”和“Healer Alpha”的黑马空降知名模型平台OpenRouter，在没有任何官方宣传的情况下，一路冲上趋势榜第一、周榜第三，日榜持续领先。

整个社区都在猜测：这是DeepSeek的新版本？还是马斯克xAI的暗牌？直到昨天，面纱终于揭开——它们来自小米，是这家手机巨头全新推出的自研大模型家族MiMo-V2系列。

今天凌晨，小米正式官宣了三款面向Agent（智能体）时代的新模型：旗舰基座MiMo-V2-Pro、全模态模型MiMo-V2-Omni，以及语音合成模型MiMo-V2-TTS。其中，最受关注的MiMo-V2-Pro拥有超过1万亿的总参数量，激活参数控制在420亿，支持高达100万token的上下文长度，是目前国内首个公开宣称达到这一量级的商用大模型。

为Agent时代量身打造的模型矩阵

此次小米发布的MiMo-V2系列是一套完整的“组合拳”，包含三个各有侧重的版本：

MiMo-V2-Pro Preview（原Hunter Alpha）：面向Agent时代的旗舰基座模型。它拥有惊人的超过1万亿的总参数量（激活参数控制在42B），并支持1M超长上下文。这意味着它能像真正的大脑一样，处理海量信息并驾驭极其复杂的任务流。

MiMo-V2-Omni（原Healer Alpha）：全模态理解模型。专为需要快速反应和低延迟的真实场景打造，能够同时处理文本、图像、音频乃至长达一小时的视频输入，是智能体感知世界的“感官”。

MiMo-V2-TTS：首款“说唱兼备”的超拟人语音大模型。由于OpenRouter平台的功能限制，它未能参与此次盲测，但其在语音合成领域的突破同样值得关注。

在权威大模型综合榜单Artificial Analysis上，旗舰机型MiMo-V2-Pro已位列全球第九、国内第三，稳稳跻身行业第一梯队。

更关键的是，这款模型从设计之初就瞄准了“智能体”这一真实应用场景。在OpenClaw等主流Agent框架的标准评测榜单PinchBench上，MiMo-V2-Pro的表现处于全球顶尖水平。这意味着它能在无人干预的情况下，自主完成复杂的工作流编排、长周期任务规划，以及精准的外部工具调用。

在过去一周的盲测中，很多开发者反馈，在复杂的Agent编排场景里，Hunter Alpha（即MiMo-V2-Pro Preview版）的实际效果已经接近Claude 4.6。

能力对标Claude Opus 4.6，价格只有1/5

如果说技术参数是“硬实力”，那么定价策略就是“硬手腕”。

小米给MiMo-V2-Pro定了一个极具冲击力的价格：在256K上下文长度内，输入token单价为每百万1美元，输出为每百万3美元；即使扩展到100万上下文，输入也只需每百万2美元，输出每百万6美元。

这是什么概念？对比行业标杆Claude Opus 4.6，后者类似服务的价格大约是MiMo-V2-Pro的五倍。对于需要大规模调用API的开发者来说，这个价差意味着成本直接打了两折。

“这基本是贴着脸打的‘价格战’。”一位业内相关人士评价，“小米的策略很明确：用接近顶级模型的能力，加上腰斩再腰斩的价格，快速抢占Agent开发者的心智和预算。”

为了加速生态渗透，小米还联合了OpenClaw、OpenCode、KiloCode、Blackbox及Cline五大主流Agent开发框架，向全球开发者提供为期一周的限时免费接口支持。

目前，MiMo-V2-Pro已经作为底层推理引擎，与金山办公实现了框架级集成。WPS的AI助手“灵犀”可以直接向搭载了MiMo-V2-Pro的“灵犀Claw”提问或布置复杂任务。小米浏览器也已全面接入该模型，提升AI搜索的信息获取效率。

在多模态方面，MiMo-V2-Omni支持文本、图像、音频、视频（最长一小时）的联合输入，在OpenClaw里可以处理网页截图、摄像头画面、音频分析等复杂任务。而MiMo-V2-TTS则展现了强大的语音合成能力，支持多种方言和音色切换，甚至能模仿特定人物的声音特征。

有了这三个模型的组合，小米可以说拥有了现阶段国内最强的Agentic模型套件。它们能覆盖从理解、规划到执行、交互的全链条，这让小米在“人车家全生态”的AI化竞争中拿到关键优势。

国内大模型竞争进入“Agent实战”新阶段

小米此次突然杀入大模型赛场，释放了一个明确信号：国内大模型的竞争重点，正在从“对话能力”转向“执行能力”。

过去一年，各家厂商还在比拼谁的中文理解更强、谁的诗词写得更好。但现在，随着OpenClaw等智能体框架的普及，市场对模型的要求变了——能不能写代码、能不能调工具、能不能完成真实工作流，成了新的试金石。

MiMo-V2-Pro的推出，意味着小米选择了一条差异化的路径：不做最会聊天的模型，要做最能“干活”的模型。

“今年小米在AI领域的投入会超过160亿元。”雷军在官宣时透露。这笔钱显然不会只用来训练参数。从与五大框架的合作，到与金山办公的集成，再到限时免费策略，小米正在用最快的速度构建自己的AI生态。

对于开发者来说，多了一个高性价比的选择总是好事。但更值得关注的是，当手机巨头、互联网大厂、创业公司都在同一个赛道里押注“智能体”时，这场竞争的终局会是什么？

或许，答案就藏在小米这次发布的潜台词里：未来的AI，不是用来聊天的，是用来干活的。而能干活的AI，最终会重新定义我们与所有设备、所有服务交互的方式。

从OpenRouter上的霸榜者，到如今全面开放的完整产品矩阵，小米用MiMo-V2系列证明了自己在大模型领域的深厚积累。

随着这些能力逐步渗透到手机、汽车、家居和办公场景中，那个由智能体驱动的未来，正离我们越来越近。

企业/人物深度

霸榜模型揭晓：小米MiMo-V2系列模型正式亮相，专为Agent打造

关注我们

189-1071-7116

服务热线（9:00-18:00）