Xiaomi MiMo-V2.5 系列现已开启公测！Token Plan 速率更优惠，夜间调用享 8 折，连续包月低至 7 折，Credits 全额重置。立即体验Xiaomi MiMo-V2.5 系列现已开启公测！Token Plan 速率更优惠，夜间调用享 8 折，连续包月低至 7 折，Credits 全额重置。立即体验Xiaomi MiMo-V2.5 系列现已开启公测！Token Plan 速率更优惠，夜间调用享 8 折，连续包月低至 7 折，Credits 全额重置。立即体验Xiaomi MiMo-V2.5 系列现已开启公测！Token Plan 速率更优惠，夜间调用享 8 折，连续包月低至 7 折，Credits 全额重置。立即体验Xiaomi MiMo-V2.5 系列现已开启公测！Token Plan 速率更优惠，夜间调用享 8 折，连续包月低至 7 折，Credits 全额重置。立即体验Xiaomi MiMo-V2.5 系列现已开启公测！Token Plan 速率更优惠，夜间调用享 8 折，连续包月低至 7 折，Credits 全额重置。立即体验Xiaomi MiMo-V2.5 系列现已开启公测！Token Plan 速率更优惠，夜间调用享 8 折，连续包月低至 7 折，Credits 全额重置。立即体验

模型与限速

本页列出 Xiaomi MiMo API 开放平台当前支持的所有模型，包含模型能力、长度限制和限流配额，帮助您根据使用场景选择合适的模型。

限流说明

平台对每个账号设有模型并发上限，服务器负载较高时可能出现响应延迟或 429 报错。建议您合理规划请求频率，在高并发场景下实现请求重试与退避策略，以避免触发限流。

RPM（Requests Per Minute）：每分钟最多发起的请求数。计算范围为调用同一模型时，单个账号下所有 API Key 的请求总数之和。
TPM（Tokens Per Minute）：每分钟最多交互的 Token 数。计算范围为调用同一模型时，单个账号下所有 API Key 的请求 Token 总数之和。

文本生成模型

模型系列	模型 ID (Model ID)	能力支持	长度限制（token）	限流
Pro 系列	`mimo-v2.5-pro`	文本生成深度思考流式输出函数调用结构化输出联网搜索	上下文窗口：1M 最大输出：128K	最大 RPM：100 最大 TPM：10M
Pro 系列	`mimo-v2-pro`	文本生成深度思考流式输出函数调用结构化输出联网搜索	上下文窗口：1M 最大输出：128K
Omni 系列	`mimo-v2.5`	文本生成全模态理解深度思考流式输出函数调用结构化输出联网搜索	上下文窗口：1M 最大输出：128K
Omni 系列	`mimo-v2-omni`	文本生成全模态理解深度思考流式输出函数调用结构化输出联网搜索	上下文窗口：256K 最大输出：128K
Flash 系列	`mimo-v2-flash`	文本生成深度思考流式输出函数调用结构化输出联网搜索	上下文窗口：256K 最大输出：64K

语音合成模型（TTS）

模型 ID (Model ID)	能力支持	长度限制（token）	限流
`mimo-v2.5-tts`	语音合成	上下文窗口：8K 最大输出：8K	最大 RPM：100 最大 TPM：10M
`mimo-v2.5-tts-voiceclone`	语音合成音色克隆
`mimo-v2.5-tts-voicedesign`	语音合成音色设计
`mimo-v2-tts`	语音合成

快速选型指南

需求场景	推荐模型
复杂推理、深度分析、长文档处理	`mimo-v2.5-pro`
图片、音频、视频内容理解	`mimo-v2.5` 或 `mimo-v2-omni`
高并发、低成本、快速响应	`mimo-v2-flash`
文字转语音（标准预置音色）	`mimo-v2.5-tts`
声音克隆（上传音频样本）	`mimo-v2.5-tts-voiceclone`
自定义音色设计	`mimo-v2.5-tts-voicedesign`

更新时间 2026 年 05 月 22 日