告警太多,反而沒人看
告警太多,反而沒人看
當你的監控、掃描或 linter 整天在響,而其中大半是誤報,你會遇到一個比「單一誤報」更麻煩的問題:真正重要的被淹沒,而且人開始不看了。
從一條誤報到沒人看
這是一條因果鏈:
- 一條監控的誤報叫 false alarm(偽警報)。
- 大量誤報累積、淹沒真訊號,這個狀態叫 noise(噪音)。
- 人因此對告警麻木、連真的也忽略,這個後果叫 alert fatigue(告警疲勞)。
為什麼是設計問題
因為每一條告警單看都「沒錯」,問題出在總量。所以解法是系統性降噪:提高告警的 precision、分級、讓每條告警都可行動。降噪不是美觀問題,是讓偵測系統還有人看的前提。
從這裡往下讀
- false alarm:監控的偽警報。
- noise:淹沒真訊號的誤報。
- alert fatigue:告警疲勞。