MiMo-V2-Pro & Omni

小米旗舰级智能体与全模态基础模型

✨ AI 摘要

MiMo-V2-Pro和MiMo-V2-Omni是小米的智能体基础模型。Pro版本专为复杂编码和工具使用任务设计，Omni版本则通过视觉和音频功能扩展了这些能力，实现现实世界交互。

适合谁

构建智能体工作流的AI开发者, 需要长链编码自动化的团队, 集成多模态AI（视觉/音频）的工程师

为什么值得关注

它提供专业化的基础模型堆栈，支持从复杂编码到现实世界多模态交互的高级智能体能力。

一位软件开发团队负责人使用MiMo-V2-Pro自动化处理遗留代码库中的复杂重构任务，模型分析依赖关系、提出架构改进建议，并在保持集成点完整性的同时执行系统性变更。
一位机器人学研究员运用MiMo-V2-Omni开发家庭助理机器人，使其能够解析语音指令、在杂乱环境中视觉识别物体，并执行多步骤物理任务，如分类回收物或寻找放错位置的物品。
一位金融分析师将MiMo-V2-Pro集成到工作流程中处理监管文件，模型提取关键合规要求、生成对应验证代码，并自动化原本需要人工交叉核对的报告工作流。