"Devops"
- 突發流量的分類
可預期 vs 不可預期的突發流量 — 不同來源、持續時間和倍率決定不同的應對策略
- 背壓機制
下游處理慢時上游怎麼減速 — 有限 buffer + 回壓訊號的設計、和 rate limit 的區別
- 容器化資源設計
Container 的 memory / CPU / 磁碟限制設計 — 資源限制設太緊 OOMKill、設太鬆擠壓其他服務、overlay filesystem 的 I/O 影響
- Rate Limiting
主動限制每個來源的請求速率 — per-client vs global、token bucket vs sliding window、優先級豁免
- 降級策略
系統超載時犧牲什麼保住什麼 — 動態取樣、事件優先級、功能降級、聚合前移四種策略
- Queue 緩衝
在 ingestion 和 processing 之間加 message queue 做 burst 緩衝 — Kafka / NATS / Redis Streams 的選型和引入條件
- 熔斷器
依賴服務失敗時怎麼快速失敗而非拖慢自己 — 三狀態模型(closed → open → half-open)和熔斷判斷條件
- Bulkhead 隔離
不同工作負載的資源池隔離 — 一個功能過載不拖垮其他功能的隔艙設計
- 規模分級應對表
自用級 → 中型 → 大型 → 商業網站級的四級應對方案 — 每級的觸發條件、架構組成和成本
- DevOps Dashboard 設計
Collector 和 SDK 是否健康 — 日常監控的服務狀態卡、吞吐量曲線、儲存用量,以及告警觸發後的排障視圖