Game day 的核心概念是「在受控環境模擬故障並演練處置流程」。它用實際操作驗證告警、分級、指揮、回滾與通訊是否真的可用。 可先對照 On-Call

概念位置

Game day 是 on-callincident timelinepost-incident-review 的訓練場景。它把文件假設轉成可觀察行為與量化結果。

可觀察訊號與例子

系統需要 game day 的訊號是流程文件完整但實戰仍常卡住。團隊可在預備環境模擬 broker 中斷、database 延遲或憑證失效,觀察 MTTR 與升級節奏是否符合預期。

設計責任

Game day 要定義演練範圍、安全邊界、成功標準、紀錄方式與復盤輸出。演練設計應避免只測單一團隊,並包含跨角色溝通與決策節點。