OpenAICompatible

语言：English · 中文

OpenAICompatible 是三个协议层模型 request 插件之一（见模型概览）。它处理任何说 OpenAI Chat Completions API 的端点 —— 今天覆盖多数商用 provider 与多数本地模型服务。

设置

python

from agently import Agently

Agently.set_settings("OpenAICompatible", {
    "base_url": "https://api.openai.com/v1",
    "api_key": "${ENV.OPENAI_API_KEY}",
    "model": "${ENV.OPENAI_MODEL}",
})

Key	含义
`base_url`	API 根，如 `https://api.openai.com/v1`
`api_key`	bearer token；本地无鉴权服务可省略
`model`	provider 模型名
`model_type`	`"chat"`（默认）或 `"completion"`（旧 completion 端点）
`request_retry`	临时传输错误重试策略；默认 `{"max_attempts": 2}`，且只在尚未开始输出时重试
`request_options`	转给底层 HTTP client 的额外 dict（timeout、header）

完整集合在 agently/builtins/plugins/ModelRequester/OpenAICompatible/ 包目录中。公开插件类由 plugin.py 导出，请求构造、鉴权、transport、handler 绑定和 response mapping 放在私有 modules/ 包下。

Responses API 变体

部分 provider（与 OpenAI 自身的新模型）说 Responses API 而非 Chat Completions。Agently 有兄弟插件：

python

Agently.set_settings("OpenAIResponsesCompatible", {
    "base_url": "https://api.openai.com/v1",
    "api_key": "${ENV.OPENAI_API_KEY}",
    "model": "${ENV.OPENAI_RESPONSES_MODEL}",
})

OpenAIResponsesCompatible 是 OpenAICompatible 的兄弟；按你端点暴露的协议选。两个插件都直接实现 ModelRequester，彼此不继承。

「OpenAI 兼容」实际覆盖什么

provider 满足 OpenAI 兼容当其端点：

接受 JSON body 含 messages: [{"role": ..., "content": ...}, ...]。
返回 JSON 响应或 token delta 的 SSE 流。
用标准字段如 model、temperature、max_tokens、tools 等。

适配的 provider：

OpenAI / Azure OpenAI
DeepSeek（https://api.deepseek.com/v1）
Qwen / DashScope 兼容模式（https://dashscope.aliyuncs.com/compatible-mode/v1）
Kimi / Moonshot（https://api.moonshot.cn/v1）
GLM（https://open.bigmodel.cn/api/paas/v4/）
MiniMax、Doubao、ERNIE —— 多数发 OpenAI 兼容模式
SiliconFlow、Groq —— 都暴露 OpenAI 兼容端点
Gemini —— 经 OpenAI 兼容端点
Ollama（本地）—— http://127.0.0.1:11434/v1
vLLM、LM Studio、llama.cpp server（本地）
多数团队在商用模型之上自建的内部网关

按 provider 的 recipe 见 Providers。

Per-agent 覆盖

agent 级设置覆盖全局：

python

agent = Agently.create_agent()
agent.set_settings("OpenAICompatible", {"model": "${ENV.OPENAI_MODEL_FAST}"})

也可经请求链做请求级覆盖 —— 见设置。

流式与 tool

OpenAICompatible 处理流式响应（被 get_generator(...) / get_async_generator(...) 用）与 tool calling（被 action runtime 用）。不需要按 provider 启用 —— 协议允许就开。

某 provider 没完全实现 OpenAI 语义中的某项时（如怪异流式格式），底层插件尽量容忍；具体 case 通过 issue 报告。

对连接重置、provider 断开连接这类临时传输错误，如果还没有任何输出发出， OpenAICompatible 默认用同一个请求重试一次。它不会改变已选模型、prompt 或结构化输出格式。设置 "request_retry": {"max_attempts": 1} 或 "request_retry": False 可以关闭这次重放。一旦输出已经开始，Agently 不会自动重放 stream，避免重复 partial content。

另见

模型概览 —— 协议选择
AnthropicCompatible —— 另一个协议插件
Providers —— 各 provider 的 recipe
模型设置 —— 快速入门级走读

OpenAICompatible ​

设置 ​

Responses API 变体 ​

「OpenAI 兼容」实际覆盖什么 ​

Per-agent 覆盖 ​

流式与 tool ​

另见 ​

OpenAICompatible

设置

Responses API 变体

「OpenAI 兼容」实际覆盖什么

Per-agent 覆盖

流式与 tool

另见