OpenAI 相容 API

2026-05-11

OpenAI 相容 API 的核心概念是「實作 OpenAI 在 2023 年定義的 POST /v1/chat/completions 介面、讓介面層工具不改一行 code 就能切換本地與雲端」。它是事實標準、後來幾乎所有本地推論伺服器都實作這份規格。

概念位置

OpenAI 相容 API 是介面層與伺服器層之間的標準介面。它承諾 API 形狀（request / response schema、streaming 格式、錯誤碼）一致；對「模型能力」「效能特性」「進階參數」等不承諾等價。本地 Gemma 4 跟雲端 GPT-5 都能用同一套 API 呼叫、但回答品質天差地遠。

可觀察訊號與例子

最小可用請求：

1curl http://localhost:11434/v1/chat/completions \
2  -H "Content-Type: application/json" \
3  -d '{
4    "model": "gemma4:31b-coding-mtp-bf16",
5    "messages": [{"role": "user", "content": "Hello"}],
6    "stream": false
7  }'

切換本地與雲端只改三個欄位：

欄位	雲端 OpenAI	本地 Ollama
API base	`https://api.openai.com/v1`	`http://localhost:11434/v1`
API key	`sk-xxxxxxx`	任意字串、本地多半略過驗證
Model name	`gpt-5`	本地 model tag

進階功能參差不齊：response_format、tool_choice、reasoning effort 等在本地伺服器的支援度視模型而定；雲端有的功能、本地未必能用。

設計責任

寫程式接 LLM 時、把 OpenAI 相容當預設選擇。多家 SDK（OpenAI Python SDK、Vercel AI SDK 等）都支援設定 base_url、改 endpoint 就能接本地。寫 IDE plugin 或 CLI 工具時、優先支援這份 API、能同時跟雲端、Ollama、LM Studio、llama.cpp、oMLX 對接。

#llm #knowledge-cards