大綱

判讀訊號

設計責任

復盤要包含影響摘要、時間線、根因、有效措施、無效措施、行動項與驗證期限。行動項需要指定 owner、完成標準與 action item closure 條件,避免停在會議紀錄。

交接路由

  • 04.8 訊號治理閉環:偵測缺口回寫成新訊號
  • 08.9 事故型態庫:抽象出 pattern
  • 08.13 repeated / toil:跨事故 pattern 的工程化處理
  • 08.16 runbook lifecycle:事故後 runbook 修訂
  • 06.18 reliability metrics:MTTR 計算的事件來源
  • 08.17 security vs operational:證據保全與 RCA 範圍
  • 6.21 Reliability Debt Backlog:復盤 action item 回寫成 reliability debt
  • 6.4 Chaos Testing:復盤教訓轉成下一輪 chaos 演練題目