OpenAI 相容 API
OpenAI 相容 API
OpenAI 相容 API 的核心概念是「實作 OpenAI 在 2023 年定義的 POST /v1/chat/completions 介面、讓介面層工具不改一行 code 就能切換本地與雲端」。它是事實標準、後來幾乎所有本地推論伺服器都實作這份規格。
概念位置
OpenAI 相容 API 是介面層與伺服器層之間的標準介面。它承諾 API 形狀(request / response schema、streaming 格式、錯誤碼)一致;對「模型能力」「效能特性」「進階參數」等不承諾等價。本地 Gemma 4 跟雲端 GPT-5 都能用同一套 API 呼叫、但回答品質天差地遠。
可觀察訊號與例子
最小可用請求:
1curl http://localhost:11434/v1/chat/completions \
2 -H "Content-Type: application/json" \
3 -d '{
4 "model": "gemma4:31b-coding-mtp-bf16",
5 "messages": [{"role": "user", "content": "Hello"}],
6 "stream": false
7 }'切換本地與雲端只改三個欄位:
| 欄位 | 雲端 OpenAI | 本地 Ollama |
|---|---|---|
| API base | https://api.openai.com/v1 | http://localhost:11434/v1 |
| API key | sk-xxxxxxx | 任意字串、本地多半略過驗證 |
| Model name | gpt-5 | 本地 model tag |
進階功能參差不齊:response_format、tool_choice、reasoning effort 等在本地伺服器的支援度視模型而定;雲端有的功能、本地未必能用。
設計責任
寫程式接 LLM 時、把 OpenAI 相容當預設選擇。多家 SDK(OpenAI Python SDK、Vercel AI SDK 等)都支援設定 base_url、改 endpoint 就能接本地。寫 IDE plugin 或 CLI 工具時、優先支援這份 API、能同時跟雲端、Ollama、LM Studio、llama.cpp、oMLX 對接。