Incident Severity

Thu, 23 Apr 2026 00:00:00 +0000

Incident severity 的核心概念是「用一致標準把事故影響分級」。分級描述的是產品影響範圍、持續時間、資料風險與回復緊急程度，技術細節放在其他層處理。可先對照 Alert。

概念位置

Incident severity 連接 alert、runbook 與 escalation policy。同一類技術錯誤在不同業務場景可能有不同等級，因此分級要以產品後果為主。

系統需要分級模型的訊號是事件發生後團隊對嚴重度判斷不一致。付款成功率下降與單一內部報表延遲都可能由 timeout 引起，但前者需要立即啟動高優先級處置，後者通常走一般排程修復。

分級要定義等級條件、升級門檻、負責角色、通訊頻率與回顧要求。等級規則應定期和事故紀錄對照，避免長期失真。