Tarragon
搜尋
文章
標籤
Now
RSS
"Inference-Server"
2026-05-14
oMLX
以 MLX 為基礎、針對 Apple Silicon 長 context 與 SSD KV cache 優化的本地推論伺服器路線
2026-05-12
6.1 推論伺服器的綁定與暴露範圍
個人 dev 場景下 llama-server / Ollama / LM Studio 的 bind address 判讀:127.0.0.1 vs LAN vs 反代、預設安全、誤開放給內網的後果