3.C61 Spotify:Autoscaling Pub/Sub consumer 反效果
3.C61 Spotify:Autoscaling Pub/Sub consumer 反效果
這個案例的核心責任是說明「subscription backlog 不等於 consumer healthy」、autoscaling 跟 ack deadline 的耦合風險。
觀察
下游 Cloud Storage export 失敗時、consumer 不 ack 仍持續消耗 CPU 處理同批訊息、造成 autoscaling 把 CPU 越拉越高的反效果;解法是 exponential backoff 抑制 CPU 消耗。
判讀
「Subscription backlog 不等於 consumer healthy」— 訊息未 ack 累積跟 autoscaling 的耦合風險。揭露 autoscale signal 該看「處理成功率」而非「CPU + backlog」。
對應大綱
Pub/Sub 進階主題:Ack deadline / autoscaling signal 設計。
下一步路由
回 Pub/Sub vendor 頁 與 3.5 紅隊章。