5 分钟接入
平台同时兼容 OpenAI / Anthropic / Gemini / OpenAI Responses 4 套协议。下游客户已有客户端 base_url 改一下、key 改一下即可使用。
1. 登录供货工作台 + 创建下游客户 Key
工作台账号由后台开通;登录 供货工作台 后创建下游客户 key,再把 base_url 和 key 交付给客户。
2. 选择协议
OpenAI 协议
key=usr-...
Anthropic 协议
x-api-key: usr-...
Gemini 协议
?key=usr-...
3. 第一个调用
复制下面命令,把 $YOUR_KEY 换成你的 key:
错误码与限额
HTTP 状态码
| HTTP | code | 说明 |
|---|---|---|
| 401 | missing_api_key / invalid_api_key | Bearer header 缺失或 key 不存在 / 被吊销 |
| 403 | account_suspended | 账户被管理员暂停。联系支持。 |
| 404 | not_found | 路径不对,确认是 /v1/chat/completions 等 |
| 429 | user_overall_cap | 整体消费上限已用完,联系管理员调整上限 |
| 429 | rate_limit | 请求 QPS 超限,几秒后重试 |
| 500 | upstream_error | 模型通道服务异常 |
| 503 | service_unavailable | 模型通道临时不可用,几分钟后再试 |
整体消费上限
每个用户独立整体消费上限(跨所有 key 累计):
- 用量金额按官方价格口径计算:输入 × 输入价 + 输出 × 输出价(见 可售模型与官方价格)
- 不按天或按月自动重置
- 用满后返回
429 user_overall_cap— 不会无声超支 - 到 供货工作台 查实时用量 + 按模型 / 按 key 分布
Chat Completions
OpenAI 标准聊天接口。支持 gpt-* / claude-* / gemini-* / grok-* 等开放模型。
请求参数
| param | 类型 | 说明 |
|---|---|---|
| model必填 | string | 模型名(参考 /models 页面) |
| messages必填 | array | [{role, content}] 数组 |
| stream | bool | 是否 SSE 流式返回,默认 false |
| temperature | number | 0–2,默认 1 |
| max_tokens | number | 响应最大 token 数 |
| tools | array | function calling 定义 |
| tool_choice | string|object | "auto" / "none" / 指定 tool |
| response_format | object | JSON mode: {"type":"json_object"} |
示例
Responses
OpenAI 新一代 API,专为 gpt-5-pro、o1、codex 等推理模型设计,原生支持 thinking budget 与 tool calling。
请求参数
| param | 类型 | 说明 |
|---|---|---|
| model必填 | string | gpt-5.4-pro / gpt-5.3-codex 等 |
| input必填 | string|array | 输入文本或多模态数组 |
| reasoning | object | {"effort":"low|medium|high"} |
| stream | bool | SSE 流式 |
示例
Embeddings
文本向量化。后端统一走向量模型端点,对调用方保持 OpenAI-API 兼容。
支持的模型
| model | 通道 | 维度 | 价格 / 1M tokens |
|---|---|---|---|
text-embedding-3-large | 统一模型通道 | OpenAI-compatible | 按网关配置 |
text-embedding-3-small | 统一模型通道 | 1536 | 按网关配置 |
text-embedding-ada-002 | 统一模型通道 | OpenAI-compatible | 按网关配置 |
请求参数
| param | 类型 | 说明 |
|---|---|---|
| model必填 | string | 见上表 |
| input必填 | string|array | 要向量化的文本或文本数组 |
| dimensions | number | 向量维度(仅 text-embedding-3 支持) |
示例
Audio Chat
带 音频输入/输出 的对话接口。基于 OpenAI 的 audio-capable chat-completions 协议(modalities 字段决定输入/输出走音频还是文本)。模型纯音频,纯文本请求会被 400 拒收。
请求参数(与 chat/completions 一致,新增)
| param | 类型 | 说明 |
|---|---|---|
| model必填 | string | gpt-audio-1.5 |
| modalities必填 | array | ["text", "audio"] 或 ["audio"] 任一 |
| audio | object | {"voice":"alloy","format":"wav"} |
| messages必填 | array | content 里包 {"type":"input_audio","input_audio":{"data":"<base64>","format":"wav"}} |
示例
Speech 转录 / 翻译
当前语音转写 / 翻译接口暂未开放。需要恢复时请先接入对应模型 profile,再在此页面补充文档。
可用模型
- 暂未开放
multipart body
| part | 说明 |
|---|---|
| audio | 音频文件(wav/mp3/m4a 等,最大 100MB) |
| definition | JSON:{"locales":["en-US"],"model":"gpt-realtime-whisper"} |
示例(curl)
Realtime(实时语音对话)
WebSocket 实时语音接口当前未开放。鉴权仍沿用 Authorization: Bearer 或查询参数 ?api-key= / ?key=(浏览器场景)。
连接参数
| param | 说明 |
|---|---|
| model | 当前唯一支持 gpt-realtime-2 |
| voice | 可选;alloy / echo / shimmer 等 |
事件协议
完全遵循 OpenAI Realtime API 的 JSON 事件结构:客户端可发 session.update / input_audio_buffer.append / response.create 等;服务端推送 session.created / response.audio.delta / response.done 等。
示例(Node + ws)
计费
按音频 token 计费(输入 $40 / 输出 $80 每 1M token,约 1 美元/分钟密集对话)。会话起止与上下行字节数记入 traffic_realtime_sessions 表,/admin#traffic 可查。
Images
图像生成。支持 gpt-image-2、grok-imagine-image 等。
请求参数
| param | 类型 | 说明 |
|---|---|---|
| model必填 | string | gpt-image-2 / grok-imagine-image |
| prompt必填 | string | 图像描述 |
| size | string | 1024x1024 / 1792x1024 |
| quality | string | standard / hd |
| n | number | 生成图片张数 (默认 1) |
示例
列出模型
返回当前可用的所有模型列表(OpenAI 标准格式)。
示例
Messages
Anthropic 原生协议。Claude SDK / Claude Code 用这个。支持 thinking、tools、web_search、code_execution、files 等高级特性。
请求参数
| param | 类型 | 说明 |
|---|---|---|
| model必填 | string | claude-fable-5 / claude-sonnet-4-6 等 |
| messages必填 | array | 对话消息数组 |
| max_tokens必填 | number | 必填,最大输出 token 数 |
| system | string | 系统提示词 |
| thinking | object | {"type":"adaptive","budget_tokens":N} |
| tools | array | 含原生 web_search_20250305 / code_execution_20250825 |
| stream | bool | SSE 流式 |
认证 header
用 x-api-key: usr-... 或 Authorization: Bearer usr-... 都可。原生 Anthropic SDK 自动用 x-api-key。
示例
generateContent
Gemini 原生协议。Google AI SDK 用这个。{model} 替换为模型名(如 gemini-2.5-pro)。
请求参数
| param | 类型 | 说明 |
|---|---|---|
| contents必填 | array | [{role,parts:[{text}]}] |
| generationConfig | object | temperature / topP / maxOutputTokens 等 |
| systemInstruction | object | 系统提示 |
| tools | array | function declarations |
认证
Gemini 用 query string:?key=usr-xxxxxxxx
示例
SSE 流式响应
所有协议都支持 streaming:
- OpenAI:请求体加
"stream": true - Anthropic:同
"stream": true - Gemini:endpoint 改成
:streamGenerateContent?alt=sse
响应是 text/event-stream,每条事件 data: {...},结束 data: [DONE]。
OpenAI 流式 chunk 结构
Tool / Function Calling
支持 OpenAI 标准 tools 参数。Claude、GPT、Gemini 都用同一格式:
Anthropic 内置工具(web_search / code_execution / computer_use)通过原生 /v1/messages 协议调用,type 使用官方版本号(如 web_search_20250305)。详见 Anthropic 官方文档。
图片输入 (Vision)
所有支持 vision 的模型都接受 OpenAI 标准的 image_url content:
支持 Claude、GPT-4o/5.x、Gemini、Grok-4.20 等。data: URL 和 https://... URL 都支持。
推理模式 (thinking)
Claude / GPT-5-pro / Grok-reasoning 等支持显式推理:
Anthropic — adaptive thinking
OpenAI Responses — effort
常见问题
Q: key 泄露了怎么办?
到 供货工作台 → API Keys → 找到那个 key → 吊销。立刻失效,可再创建新的。
Q: 怎么查实时用量?
登录 供货工作台,首屏显示累计用量 / 整体上限。明细按模型 / 时间分布在 用量 标签。
Q: 数据安全 — prompt 会被记录吗?
请求体不持久化磁盘。仅 token 数 + 模型 + 时间用于计费。响应不存。
Q: 不在列表里的模型可以加吗?
联系管理员开通即可(本网关已接入几乎所有主流厂商模型)。
Q: 支持 batch API 吗?
暂不支持 OpenAI batch endpoint。如有需要联系管理员。
Q: 支持 function calling 吗?
支持。OpenAI 标准 tools 字段在所有模型都生效,详见 Tool / Function Calling。
Q: 国内能直接调吗?
本网关使用公网 API 节点,国内直连或加速都可。如果有网络问题用国内 VPS 中转一次。
Q: 联系方式
飞书 → 找运维 / 管理员。问题请提供 (1) 你的 email (2) 调用时间 (3) HTTP code + 响应体。