這篇對照的核心責任是避免把單一快取做法視為通用解。

小型服務常見判讀

小型服務最常遇到的問題是切換時沒有先保護回源,快取架構本身夠用。用 cache-aside + TTL 完全可行,但如果沒有 warmup 與簡單限流,某次部署就可能讓熱門 key 全部 miss,直接打爆資料庫。

中型服務常見判讀

中型服務開始同時承受活動流量與版本切換壓力。這時失敗通常出在「切換順序」而不是策略名稱。先改 key 結構還是先改 TTL,會決定是否出現 stampede 連鎖反應。

大型服務常見判讀

大型服務下,快取已經是資料平面的一部分。跨區路由、分層儲存與一致性窗口會直接影響業務正確性。這個階段若只盯 hit rate,會漏掉最關鍵的資料一致性風險。

這個情境的專屬告警條件

  • origin QPS 在 5 分鐘內超過基線 2 倍且持續上升
  • 熱門 key miss 同步上升,並伴隨重試流量增加
  • stale read 比例連續惡化

任何一條成立就先暫停切換,回退上一個策略狀態,優先保護回源與資料一致性。