模型与限速
本页列出 Xiaomi MiMo API 开放平台当前支持的所有模型,包含模型能力、长度限制和限流配额,帮助您根据使用场景选择合适的模型。
限流说明
平台对每个账号设有模型并发上限,服务器负载较高时可能出现响应延迟或 429 报错。建议您合理规划请求频率,在高并发场景下实现请求重试与退避策略,以避免触发限流。
- RPM(Requests Per Minute):每分钟最多发起的请求数。计算范围为调用同一模型时,单个账号下所有 API Key 的请求总数之和。
- TPM(Tokens Per Minute):每分钟最多交互的 Token 数。计算范围为调用同一模型时,单个账号下所有 API Key 的请求 Token 总数之和。
文本生成模型
| 模型系列 | 模型 ID (Model ID) | 能力支持 | 长度限制(token) | 限流 |
|---|---|---|---|---|
| Pro 系列 | mimo-v2.5-pro |
文本生成 深度思考 流式输出 函数调用 结构化输出 联网搜索 |
上下文窗口:1M 最大输出:128K |
最大 RPM:100 最大 TPM:10M |
mimo-v2-pro | ||||
| Omni 系列 | mimo-v2.5 |
文本生成 全模态理解 深度思考 流式输出 函数调用 结构化输出 联网搜索 |
上下文窗口:1M 最大输出:128K | |
mimo-v2-omni |
上下文窗口:256K 最大输出:128K | |||
| Flash 系列 | mimo-v2-flash |
文本生成 深度思考 流式输出 函数调用 结构化输出 联网搜索 |
上下文窗口:256K 最大输出:64K |
语音合成模型(TTS)
| 模型 ID (Model ID) | 能力支持 | 长度限制(token) | 限流 |
|---|---|---|---|
mimo-v2.5-tts |
语音合成 | 上下文窗口:8K 最大输出:8K |
最大 RPM:100 最大 TPM:10M |
mimo-v2.5-tts-voiceclone |
语音合成 音色克隆 | ||
mimo-v2.5-tts-voicedesign |
语音合成 音色设计 | ||
mimo-v2-tts |
语音合成 |
快速选型指南
| 需求场景 | 推荐模型 |
|---|---|
| 复杂推理、深度分析、长文档处理 | mimo-v2.5-pro |
| 图片、音频、视频内容理解 | mimo-v2.5 或 mimo-v2-omni |
| 高并发、低成本、快速响应 | mimo-v2-flash |
| 文字转语音(标准预置音色) | mimo-v2.5-tts |
| 声音克隆(上传音频样本) | mimo-v2.5-tts-voiceclone |
| 自定义音色设计 | mimo-v2.5-tts-voicedesign |
更新时间 2026 年 05 月 22 日