1. 小米
toiotech
  • toiotech接口说明
  • 已支持的模型列表
  • 大模型官方文档
  • Claude thinking 多轮对话
  • thinking相关说明
  • 已支持的模型列表
    • 语言大模型
      • OpenAI
        • gpt-4
        • gpt-4.1
        • gpt-4o
        • gpt-4o-mini
        • gpt-5
        • gpt-5-chat
        • gpt-5-mini
        • gpt-5-nano
        • gpt-5.1
        • gpt-5.1-chat-latest
        • gpt-5.1-codex(仅支持/v1/responses)
        • gpt-5.2
        • gpt-5.2(responses)
        • gpt-5.2-chat
        • gpt-5.2-pro(仅支持/v1/responses)
        • gpt-oss-120b
        • o1
        • o3
        • o3-mini
        • o3-deep-research
        • o3-pro
        • o4-mini
        • o4-mini-deep-research
        • gpt-5.4
        • gpt-5.4-pro
      • Google
        • gemini-2.0-flash
        • gemini-2.5-computer-use-preview-10-2025
        • gemini-2.5-flash
        • gemini-2.5-flash-lite
        • gemini-2.5-flash-lite-preview
        • gemini-2.5-pro
        • gemini-3-flash-preview
        • gemini-3-pro-preview
        • gemini-robotics-er-1.5-preview
        • gemini-(thinking_config)openai请求格式
        • gemini-3.1-pro-preview(多模态)
        • gemini-3.1-flash-lite-preview(多模态)
        • gemini-3.1-flash-lite-preview(thinking)
        • gemini-2.5-pro(原生请求格式)
      • Anthropic
        • 通用接口
        • claude-opus-4-5-20251101
        • claude-opus-4-20250514
        • claude-sonnet-4-20250514
        • claude-sonnet-4-5-20250929
        • claude-(Interleaved thinking)
        • claude-opus-4-6
        • claude-sonnet-4-6
      • DeepSeek
        • deepseek-chat
        • deepseek-reasoner
      • MiniMax
        • abab6.5s-chat
        • minimax-m2
        • minimax-m2.5
      • Moonshot
        • kimi-k2
        • kimi-k2-0711-preview
        • kimi-k2-0905
        • kimi-k2-instruct
        • kimi-k2-thinking
        • moonshot-v1-128k
        • moonshot-v1-32k
        • moonshot-v1-8k
        • moonshot-v1-128k-vision-preview
        • moonshot-v1-32k-vision-preview
        • moonshot-v1-8k-vision-preview
        • kimi-k2.5
        • 获取系统工具
        • 执行系统工具
      • xAI
        • grok-4
        • grok-4-1-fast-non-reasoning
        • grok-4-1-fast-reasoning
      • 字节跳动
        • 通用接口
        • doubao-1.8图片理解
        • doubao-1.8(视频理解)
        • doubao-seed-2-0-pro-260215(图片理解)
        • doubao-seed-2-0-pro-260215(视频理解)
      • 智谱
        • glm-4-plus
        • glm-4.5
        • glm-4.6
        • glm-4.7
        • glm-5
      • 阿里巴巴
        • qwen-max
        • qwen-max-2025-01-25
        • qwen-max-latest
        • qwen-plus
        • qwen-plus-latest
        • qwen-turbo
        • qwen2.5-7b-instruct
        • qwen2.5-32b-instruct
        • qwen2.5-72b-instruct
        • qwen3-coder-plus
        • qwen3-coder-plus-2025-07-22
        • qwen3-max
        • qwen3-max-preview
        • qwen3-235b-a22b
        • qwen3-235b-a22b-instruct-2507
        • qwen3-235b-a22b-thinking-2507
        • qwen3-8b
        • qwen3-coder-30b-a3b-instruct
        • qwen3-next-80b-a3b-instruct
        • qwen3-next-80b-a3b-thinking
        • qwen-vl-max(视觉理解)
        • qwen-vl-plus(视觉理解)
        • qwen3-vl-235b-a22b-instruct(视觉理解)
        • qwen3-vl-235b-a22b-thinking(视觉理解)
        • qwen3-vl-30b-a3b-thinking(图片理解)
        • qwen3-vl-30b-a3b-thinking(视频理解)
        • qwen3-max-2026-01-23(qwen3-max-thinking)
        • qwen3-max-2026-01-23(非思考模式)
        • qwen3.5-397b-a17b(多模态)
        • qwen3.5-plus(多模态)
        • qwen3.5-flash(多模态)
        • qwen3.5-122b-a10b(多模态)
        • qwen3.5-35b-a3b
        • qwen3.5-omni-plus(视频+文本)
        • qwen3.5-omni-plus(音频+文本)
        • qwen3.5-omni-plus(图片+文本)
        • qwen3.5-omni-flash(图片+文本)
      • 百度
        • ernie-x1-32k
        • ernie-5.0-thinking-exp
        • ernie-5.0-thinking-preview
      • 腾讯
        • hunyuan-t1-latest
      • 讯飞
        • SparkDesk-v4.0
      • 蚂蚁
        • Ling-1T
        • Ring-1T
      • 阶跃星辰
        • step-3
      • 小米
        • mimo-v2-pro
          POST
        • mimo-v2-omni(多模态理解)
          POST
    • 图片生成
      • 通用接口
        • 图片生成
        • 图片编辑
      • OpenAI
        • gpt-image系列图片生成
        • gpt-image系列图片编辑
        • dall-e-3图片生成
      • Google
        • gemini-3-pro-image-preview
        • gemini-3.1-flash-image-preview
        • gemini-2.5-flash-image
        • gemini-2.5-flash-image-preview
      • Anthropic
      • BFL
        • flux-1-kontext-pro
      • ImagineArt
        • imagineart-1.5-preview
      • 字节跳动豆包
        • doubao-seedream-5-0-260128(文生图)
        • doubao-seedream-5-0-260128(图生图)
    • 音视频处理
      • OpenAI
        • gpt-4o-audio-preview
        • gpt-audio
      • 阿里巴巴
        • qwen3-tts-flash
      • Elevenlabs
        • eleven_v3
      • MiniMax
        • 通用接口
    • 视频生成
      • Vidu
        • vidu-2.0-img2video
        • viduq2-pro提交图生视频任务
        • viduq3-pro图生视频
        • viduq3-pro文生视频
      • 字节跳动
        • 提交图生视频生成任务
        • 提交文生视频生成任务
      • 快手
        • kling提交图生视频任务
        • kling提交文生视频任务
        • kling-v3提交图生视频任务
        • kling-v3提交文生视频任务
      • 腾讯
        • hunyuan-video-v1.5
      • 海螺
        • 提交图生视频任务
        • 提交文生视频任务
      • sora
        • sora-2
        • sora-2-pro
      • Google
        • veo-3.1-generate-preview
        • veo-3.1-fast-generate-preview
      • 阿里巴巴
        • wan2.6-i2v
        • wan2.6-t2v
      • pixverse
        • pixverse-v5.5-t2v
        • pixverse-v5.5-i2v
        • pixverse-v5.6-i2v
        • pixverse-v5.6-t2v
      • ltx
        • 文生视频
        • 图生视频
      • worldlabs
        • 文生视频(world)
        • 图生视频(world)
        • 多图生视频(world)
      • runawayml
        • 提交gen4.5(文生视频)
        • 提交gen4.5(图生视频)
    • 多模态模型
      • 智谱
        • glm-4.5v
        • glm-4.6v
      • 阿里巴巴
        • qwen2.5-omni-7b
        • qwen2.5-vl-72b-instruct
        • qwen3-omni-flash-2025-12-01
      • 日日新
        • SenseNova-V6-Pro
    • Realtime
      • OpenAI
        • gpt-4o-mini-realtime-preview
        • gpt-4o-realtime-preview
        • gpt-realtime-1.5
      • qwen阿里云
        • qwen3-omni-flash-realtime
      • gemini
        • gemini-3.1-flash-live-preview
    • 向量化
      • OpenAI
        • text-embedding-3-large
        • text-embedding-3-small
        • text-embedding-ada-002
        • text-embedding-v1
    • 代码解释器
      • qwen3-模型
  • 已支持的搜索服务
    • serper
      • get方式
      • post方式
  • gemini
    • openai格式
      • gpt-5.2
      • openai格式
      • gemini-开启thinking
    • google原生格式
      • gemini-robotics-er-1.5-preview
      • google格式
  • anthropic
    • anthropic格式
      • anthropic格式
      • tools调用
      • thinking
      • image理解
      • code_execution
      • 关闭thinking
    • openai格式
      • openai格式
  • openai
    • chat/completions
    • 流式/chat/completions
    • responses
  • deepseek
    • chat/completions
  • qwen
    • qwen提交文生视频任务
    • qwen提交图生视频任务
    • qwen3-omni-flash
    • chat/completions(开启thinking)
    • chat/completions
  • 获取异步任务结果
    GET
  1. 小米

mimo-v2-omni(多模态理解)

Developing
POST
/v1/chat/completions
https://platform.xiaomimimo.com/#/docs/usage-guide/multimodal-understanding/image-understanding
单独理解图片、视频、音频是可以的。
同时传递这些,大模型有时候返回的内容质量不高

Request

Authorization
Provide your bearer token in the
Authorization
header when making requests to protected resources.
Example:
Authorization: Bearer ********************
Body Params application/jsonRequired

Example
{
    "model": "mimo-v2-omni",
    "messages": [
        {
            "role": "system",
            "content": "You are MiMo, an AI assistant developed by Xiaomi. Today is date: Tuesday, December 16, 2025. Your knowledge cutoff date is December 2024."
        },
        {
            "role": "user",
            "content": [
                {
                    "type": "video_url",
                    "video_url": {
                        "url": "https://example-files.cnbj1.mi-fds.com/example-files/video/video_example.mp4"
                    },
                    "fps": 2,
                    "media_resolution": "default"
                },
                {
                    "type": "input_audio",
                    "input_audio": {
                        "data": "https://example-files.cnbj1.mi-fds.com/example-files/audio/audio_example.wav"
                    }
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://example-files.cnbj1.mi-fds.com/example-files/image/image_example.png"
                    }
                },
                {
                    "type": "text",
                    "text": "描述一下这个视频、音频、图片的主要内容。每个附件的描述不少于20个字。"
                }
            ]
        }
    ],
    "max_completion_tokens": 1024
}

Request Code Samples

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
Request Request Example
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.toiotech.com/v1/chat/completions' \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "mimo-v2-omni",
    "messages": [
        {
            "role": "system",
            "content": "You are MiMo, an AI assistant developed by Xiaomi. Today is date: Tuesday, December 16, 2025. Your knowledge cutoff date is December 2024."
        },
        {
            "role": "user",
            "content": [
                {
                    "type": "video_url",
                    "video_url": {
                        "url": "https://example-files.cnbj1.mi-fds.com/example-files/video/video_example.mp4"
                    },
                    "fps": 2,
                    "media_resolution": "default"
                },
                {
                    "type": "input_audio",
                    "input_audio": {
                        "data": "https://example-files.cnbj1.mi-fds.com/example-files/audio/audio_example.wav"
                    }
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://example-files.cnbj1.mi-fds.com/example-files/image/image_example.png"
                    }
                },
                {
                    "type": "text",
                    "text": "描述一下这个视频、音频、图片的主要内容。每个附件的描述不少于20个字。"
                }
            ]
        }
    ],
    "max_completion_tokens": 1024
}'

Responses

🟢200Success
application/json
Body

Example
{
    "id": "47e182ef6cac4bc9bc07c7c825561239",
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "message": {
                "content": "### 视频内容  \n视频展示了一只白色蓝眼睛的小猫坐在窗边的木质台面上,阳光透过浅色窗帘柔和地洒在它身上,背景有绿色植物点缀,整体氛围温馨宁静,小猫姿态可爱,光影效果温暖治愈。  \n\n\n### 音频内容  \n音频包含清晨的鸟鸣声与自然环境的细微声响,营造出宁静清新的氛围,仿佛置身于户外清晨的静谧场景中,声音柔和悦耳,传递出平和放松的感觉。  \n\n\n### 图片内容  \n图片呈现了一片茂密的森林,溪流蜿蜒穿过其间,阳光透过树木枝叶洒下金色光束,溪边布满苔藓、蕨类植物,石头错落分布,画面静谧清新,充满自然生机与治愈感。",
                "role": "assistant",
                "tool_calls": null,
                "reasoning_content": "用户现在需要分别描述视频、音频、图片的内容,每个不少于20字。首先看视频部分,视频里是一只白色蓝眼睛的小猫坐在窗边,阳光透过窗帘洒进来,背景有绿植,所以要描述清楚场景、主体、光线等。然后音频,音频里有鸟鸣声,可能还有环境音,比如自然的声音,所以要说明音频的内容,比如清晨的鸟鸣,营造的氛围。图片部分,图片是森林里的溪流,阳光透过树木,苔藓、蕨类植物,所以要描述森林溪流的景象,阳光、植被、水流等。\n\n首先处理视频:视频展示了一只白色蓝眼睛的小猫坐在窗边的木质台面上,阳光透过浅色窗帘洒在它身上,背景有绿色植物,整体氛围温馨宁静,小猫姿态可爱,画面充满温暖的光影效果。\n\n然后音频:音频包含清晨的鸟鸣声,可能还有自然环境的细微声响,营造出宁静清新的氛围,仿佛置身于清晨的户外,声音柔和悦耳,传递出平和的感觉。\n\n图片:图片呈现了一片茂密的森林,溪流蜿蜒穿过,阳光透过树木枝叶洒下光束,溪边布满苔藓和蕨类植物,石头错落,整体画面静谧清新,充满自然生机。\n\n现在需要确保每个描述不少于20字,检查一下:\n\n视频描述:视频中一只白色蓝眼睛的小猫坐在窗边木质台面上,阳光透过窗帘洒下,背景有绿植,画面温馨宁静,小猫姿态可爱,光影温暖。\n\n音频描述:音频包含清晨的鸟鸣声与自然环境音,营造出宁静清新的氛围,仿佛置身户外清晨,声音柔和悦耳,传递平和感。\n\n图片描述:图片展现茂密森林中溪流蜿蜒,阳光透过树木洒下光束,溪边苔藓蕨类繁茂,石头错落,画面静谧清新,充满自然生机。\n\n这样每个都超过20字了,现在整理成清晰的描述,分别对应视频、音频、图片。"
            }
        }
    ],
    "created": 1773893429,
    "model": "mimo-v2-omni",
    "object": "chat.completion",
    "usage": {
        "completion_tokens": 609,
        "prompt_tokens": 2033,
        "total_tokens": 2642,
        "completion_tokens_details": {
            "reasoning_tokens": 438
        },
        "prompt_tokens_details": {
            "audio_tokens": 45,
            "cached_tokens": 14,
            "image_tokens": 1024,
            "video_tokens": 858
        }
    }
}
Modified at 2026-03-19 04:12:36
Previous
mimo-v2-pro
Next
图片生成
Built with