小米发布MIT授权MiMo模型,专为长任务AI智能体设计
小米近日正式发布并开源了MiMo-V2.5与MiMo-V2.5-Pro两款模型,采用MIT许可证,为开发者提供了一个潜在的低成本选择,用于构建能够执行编程、工作流自动化等长时任务的AI智能体。
两款模型均支持100万Token的上下文窗口。其中,MiMo-V2.5-Pro专为复杂智能体任务和编程场景设计,而MiMo-V2.5则是一款原生全模态模型,支持文本、图像、视频和音频输入。
此次发布恰逢智能体AI工作负载对企业AI预算带来新压力之际。这类系统在规划任务、调用工具、编写代码及处理错误的过程中会消耗大量Token,使得成本管控和部署灵活性对开发者而言愈发重要。
小米表示,通过采用MIT许可证,企业可以自由对模型进行商业部署、持续训练和微调,无需额外授权。Kadence International高级副总裁图利卡·希尔(Tulika Sheel)认为,MIT许可证使该模型颇具吸引力。她表示:"该许可允许企业自由修改、部署和商业化模型,不受任何限制,这在当前AI领域实属罕见。"
在ClawEval测试基准上,小米在博客中指出:"MiMo-V2.5-Pro的Pass?得分达到64%,每条轨迹仅消耗约7万个Token,与Claude Opus 4.6、Gemini 3.1 Pro及GPT-5.4在同等能力水平下相比,Token消耗减少约40%至60%。"
两款模型均采用稀疏混合专家(MoE)架构以控制计算成本。拥有3100亿参数的MiMo-V2.5每次请求仅激活150亿个参数,而拥有1.02万亿参数的Pro版本每次激活420亿个参数。小米表示,Pro版本的混合注意力设计在处理长上下文任务时,可将KV缓存存储需求降低近7倍。
小米还列举了多项长任务测试案例,包括MiMo-V2.5-Pro在4.3小时内通过672次工具调用完成了一个Rust语言编写的SysY编译器,全部233个隐藏测试用例均通过。此外,该模型还在11.5小时的自主运行中,经过1868次工具调用,生成了一个包含8192行代码的桌面视频编辑器。
小米MiMo-V2.5系列模型能否在智能体编程和自动化工作负载领域赢得企业开发者的青睐,最终将取决于企业在性能、成本与风险之间的综合评估。
Omdia首席分析师连杰苏(Lian Jye Su)表示:"企业开发者在评估小米MiMo-V2.5及其衍生版本时,应着重考量总拥有成本(TCO),包括Token效率、每次成功任务的成本,以及相较于专有模型所节省的授权费用。闭源前沿模型在通用任务和极端边缘案例上可能仍占优势,但开源权重模型在高并发量的智能体工作场景中表现更为出色。"
Pareekh Consulting首席执行官帕里克·贾因(Pareekh Jain)建议,企业不应将MiMo-V2.5视为Claude或GPT的替代品,而应将其定位为适用于高Token消耗工作负载的高性价比智能体模型。
"关键的基准信号不只是准确率,而是每次成功任务所消耗的Token数量,"贾因说道,"前沿模型在复杂编程基准测试中往往能获得更高的成功率,但代价是巨大的推理开销。MiMo-V2.5的设计核心是Token效率,即以明显更少的输入输出Token实现可比的结果。"
贾因认为,这使得类MiMo模型可以成为重复性编程、质量保证、迁移、文档整理、测试及自动化工作负载的"经济型主力",而闭源前沿模型则继续在最高难度任务中保持质量上限。
Gartner高级首席分析师阿希什·班纳吉(Ashish Banerjee)表示,MiMo这类模型有望从根本上改变企业长任务智能体的AI经济模式。
"当任务延伸至数百万Token时,按量计费的专有API看起来不再是一种便利,而更像是对迭代的一种'税收',"班纳吉说,"相比之下,MiMo的MIT许可证、开放权重、100万Token上下文窗口以及相对低廉的定价,使私有云或自托管部署在战略上具有相当的可信度。"
不过,班纳吉也指出,这并不意味着企业会完全放弃专有API。
"企业将继续使用专有API来追求前沿精度和低运营消耗,同时将规模化、可重复的智能体工作流转向开源模型,因为在这些场景下,成本可预测性、数据控制权和定制化能力更为重要,"班纳吉表示,"简而言之,长任务、高并发的智能体AI将演变为混合市场格局,MiMo等开源模型将打破对纯API的依赖。"
连杰苏也补充指出,由于源自中国的模型可能在西方受监管组织中引发合规顾虑,该模型的市场推广或将面临一定挑战。
Q&A
Q1:MiMo-V2.5与MiMo-V2.5-Pro有什么区别?
A:MiMo-V2.5是一款原生全模态模型,支持文本、图像、视频和音频多种输入形式;而MiMo-V2.5-Pro则专为复杂智能体任务和编程场景设计,拥有1.02万亿参数,每次请求激活420亿参数,并具备混合注意力设计,可将KV缓存存储需求降低近7倍,更适合处理长上下文的高难度任务。
Q2:MiMo-V2.5的Token效率相比其他主流模型有多大优势?
A:根据小米官方数据,在ClawEval基准测试中,MiMo-V2.5-Pro的Pass?得分达到64%,每条轨迹仅消耗约7万个Token,与Claude Opus 4.6、Gemini 3.1 Pro及GPT-5.4在同等能力水平下相比,Token消耗减少约40%至60%。这意味着在高并发、长任务的智能体工作场景中,使用MiMo可以显著降低运行成本。
Q3:企业采用MiMo-V2.5模型时需要注意哪些风险?
A:分析师指出,企业在评估MiMo-V2.5时应综合考量总拥有成本,包括Token效率和每次成功任务的成本。此外,闭源前沿模型在通用任务和极端边缘场景中仍具优势。值得注意的是,MiMo作为中国来源的模型,在西方受监管行业或组织中可能面临合规审查和采购顾虑,企业需结合自身的数据合规要求审慎评估。

