Liveness 的核心概念是「判斷 instance 是否仍能維持基本存活」。平台用這類訊號決定是否重啟 instance;readiness 則決定 instance 是否接收正式流量。 可先對照 Health Check

概念位置

Liveness 關注 process 是否卡死、主 loop 是否停止、必要 runtime 是否失效。Readiness 關注接流量條件。兩者混用會讓平台在下游短暫故障時重啟正常 instance,造成更大波動。 可先對照 Health Check

可觀察訊號與例子

系統需要分清 liveness 與 readiness 的訊號是部署或下游波動時 instance 被反覆重啟。資料庫短暫 timeout 應影響 readiness 或功能降級;process deadlock 才應觸發 liveness 失敗。

設計責任

Liveness check 要簡單、穩定、成本低。Runbook 應說明 liveness fail 代表什麼、平台何時重啟、重啟後如何觀察 crash loop 與資源限制。