<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Peak-Event on Tarragon</title><link>https://tarrragon.github.io/blog/tags/peak-event/</link><description>Recent content in Peak-Event on Tarragon</description><generator>Hugo -- gohugo.io</generator><language>zh-TW</language><copyright>Tarragon (CC BY 4.0)</copyright><lastBuildDate>Tue, 12 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://tarrragon.github.io/blog/tags/peak-event/index.xml" rel="self" type="application/rss+xml"/><item><title>9.11 高峰事件準備</title><link>https://tarrragon.github.io/blog/backend/09-performance-capacity/peak-event-readiness/</link><pubDate>Tue, 12 May 2026 00:00:00 +0000</pubDate><guid>https://tarrragon.github.io/blog/backend/09-performance-capacity/peak-event-readiness/</guid><description>&lt;h2 id="概念定位">概念定位&lt;/h2>
&lt;p>高峰事件準備的責任是把「事件臨頭才動手」變成「事前數週流程化準備」。沒有 readiness 流程時、年度活動靠 oncall 撐、出事率高；有流程之後、活動成「routine event」、工程資源穩定釋放。&lt;/p>
&lt;p>本章 &lt;em>是&lt;/em> &lt;a href="https://tarrragon.github.io/blog/backend/09-performance-capacity/production-validation/" data-link-title="9.10 Production-Side 驗證" data-link-desc="shadow traffic、dark launch、canary、production-like load test">9.10 Production-Side 驗證&lt;/a> 跟 &lt;a href="https://tarrragon.github.io/blog/backend/09-performance-capacity/capacity-planning/" data-link-title="9.6 容量規劃模型" data-link-desc="peak forecast、headroom budget、growth curve、autoscaling sizing">9.6 容量規劃模型&lt;/a> 在「事件型場景」的應用組合、不重新建立方法論。要看具體方法回到那兩章、本章聚焦在 &lt;em>流程整合&lt;/em>。&lt;/p>
&lt;p>讀完後讀者能設計一個 T-90 → T-0 的事件準備時程、回答「Black Friday 該怎麼準備、Super Bowl 該怎麼準備、新片發布該怎麼準備」。&lt;/p>
&lt;h2 id="事件分類五種負載形狀">事件分類：五種負載形狀&lt;/h2>
&lt;p>不同事件對應不同準備強度、第一步要分類。&lt;/p>
&lt;p>&lt;strong>可預期極端峰值&lt;/strong>：年度活動、預售、賽事決賽。提前數月已知時間、業務影響大。例：Prime Day、Black Friday、Super Bowl、IPL 決賽。
&lt;strong>事件型不可預期峰值&lt;/strong>：賽事高潮、突發新聞、KOL 推廣。時間或大小不完全可預測。例：賽事進球瞬間、KOL 帶貨、突發新聞引發的流量。
&lt;strong>Flash-sale 瞬間爆量&lt;/strong>：售票開賣、報名活動、限量搶購。t=0 瞬間爆量、5-30 分鐘結束。例：演唱會售票、限量商品搶購、報名截止前最後一小時。
&lt;strong>產品爆紅 surge&lt;/strong>：新 app 紅、病毒擴散。完全不可預期、流量會隨熱度消退。例：Pokemon GO、ChatGPT 爆紅初期、TikTok challenge。
&lt;strong>結構性 surge&lt;/strong>：COVID 類外部衝擊、永久 baseline 上移。不會回到舊水準。例：COVID 期間遠距工作工具、烏俄戰爭期間能源類 app。&lt;/p>
&lt;p>對應案例：&lt;a href="https://tarrragon.github.io/blog/backend/09-performance-capacity/cases/" data-link-title="模組九案例正文" data-link-desc="雲端服務商實戰案例庫 — 從 AWS / GCP / Azure 公開案例整理高併發、峰值流量與容量規劃實踐">9.C1 / 9.C13 / 9.C21 / 9.C27 / 9.C29&lt;/a>（predictable）/ &lt;a href="https://tarrragon.github.io/blog/backend/09-performance-capacity/cases/" data-link-title="模組九案例正文" data-link-desc="雲端服務商實戰案例庫 — 從 AWS / GCP / Azure 公開案例整理高併發、峰值流量與容量規劃實踐">9.C2 / 9.C4 / 9.C7 / 9.C28&lt;/a>（event）/ &lt;a href="https://tarrragon.github.io/blog/backend/09-performance-capacity/cases/" data-link-title="模組九案例正文" data-link-desc="雲端服務商實戰案例庫 — 從 AWS / GCP / Azure 公開案例整理高併發、峰值流量與容量規劃實踐">9.C15 / 9.C16 / 9.C17&lt;/a>（flash-sale）/ &lt;a href="https://tarrragon.github.io/blog/backend/09-performance-capacity/cases/" data-link-title="模組九案例正文" data-link-desc="雲端服務商實戰案例庫 — 從 AWS / GCP / Azure 公開案例整理高併發、峰值流量與容量規劃實踐">9.C8 / 9.C18&lt;/a>（surge）。&lt;/p>
&lt;h2 id="t-90--t-0-準備時程">T-90 → T-0 準備時程&lt;/h2>
&lt;p>可預期極端峰值的完整準備時程：&lt;/p>
&lt;p>&lt;strong>T-90 天&lt;/strong>：流量 forecast + 容量計畫敲定。確認預期峰值倍數、確認 headroom 比例、確認跨 region / AZ 分布。產出 &lt;em>容量計畫文件&lt;/em>。&lt;/p>
&lt;p>&lt;strong>T-30 天&lt;/strong>：基礎設施 quota 申請。雲端 instance limit、connection pool、API rate limit、DynamoDB throughput、Lambda concurrency 都要 &lt;em>提前申請&lt;/em>、不能事件當天才發現 quota 不夠。AWS Infrastructure Event Management（IEM）等服務在這階段啟動。&lt;/p>
&lt;p>&lt;strong>T-14 天&lt;/strong>：第一輪 production-like 壓測。驗證容量計畫是否真的能撐預期峰值、找出第一輪 bottleneck。&lt;/p>
&lt;p>&lt;strong>T-7 天&lt;/strong>：完整 game day 演練。注入故障場景（DB failure、AZ outage、第三方 quota 耗盡）、驗證降級、failover、rollback 流程。修正最後問題、更新 runbook。&lt;/p>
&lt;p>&lt;strong>T-2 天&lt;/strong>：pre-scaling 開始。CDN cache pre-warm、Lambda provisioned concurrency 啟動、autoscaler scheduled 開始、DB capacity 預先 scale up。避免事件當天還在 boot。&lt;/p>
&lt;p>&lt;strong>T-0 day&lt;/strong>：watch room 待命、runbook 開機可執行。所有相關 oncall 跨團隊聯合 channel、dashboard 集中、escalation path 清楚。&lt;/p></description><content:encoded><![CDATA[<h2 id="概念定位">概念定位</h2>
<p>高峰事件準備的責任是把「事件臨頭才動手」變成「事前數週流程化準備」。沒有 readiness 流程時、年度活動靠 oncall 撐、出事率高；有流程之後、活動成「routine event」、工程資源穩定釋放。</p>
<p>本章 <em>是</em> <a href="/blog/backend/09-performance-capacity/production-validation/" data-link-title="9.10 Production-Side 驗證" data-link-desc="shadow traffic、dark launch、canary、production-like load test">9.10 Production-Side 驗證</a> 跟 <a href="/blog/backend/09-performance-capacity/capacity-planning/" data-link-title="9.6 容量規劃模型" data-link-desc="peak forecast、headroom budget、growth curve、autoscaling sizing">9.6 容量規劃模型</a> 在「事件型場景」的應用組合、不重新建立方法論。要看具體方法回到那兩章、本章聚焦在 <em>流程整合</em>。</p>
<p>讀完後讀者能設計一個 T-90 → T-0 的事件準備時程、回答「Black Friday 該怎麼準備、Super Bowl 該怎麼準備、新片發布該怎麼準備」。</p>
<h2 id="事件分類五種負載形狀">事件分類：五種負載形狀</h2>
<p>不同事件對應不同準備強度、第一步要分類。</p>
<p><strong>可預期極端峰值</strong>：年度活動、預售、賽事決賽。提前數月已知時間、業務影響大。例：Prime Day、Black Friday、Super Bowl、IPL 決賽。
<strong>事件型不可預期峰值</strong>：賽事高潮、突發新聞、KOL 推廣。時間或大小不完全可預測。例：賽事進球瞬間、KOL 帶貨、突發新聞引發的流量。
<strong>Flash-sale 瞬間爆量</strong>：售票開賣、報名活動、限量搶購。t=0 瞬間爆量、5-30 分鐘結束。例：演唱會售票、限量商品搶購、報名截止前最後一小時。
<strong>產品爆紅 surge</strong>：新 app 紅、病毒擴散。完全不可預期、流量會隨熱度消退。例：Pokemon GO、ChatGPT 爆紅初期、TikTok challenge。
<strong>結構性 surge</strong>：COVID 類外部衝擊、永久 baseline 上移。不會回到舊水準。例：COVID 期間遠距工作工具、烏俄戰爭期間能源類 app。</p>
<p>對應案例：<a href="/blog/backend/09-performance-capacity/cases/" data-link-title="模組九案例正文" data-link-desc="雲端服務商實戰案例庫 — 從 AWS / GCP / Azure 公開案例整理高併發、峰值流量與容量規劃實踐">9.C1 / 9.C13 / 9.C21 / 9.C27 / 9.C29</a>（predictable）/ <a href="/blog/backend/09-performance-capacity/cases/" data-link-title="模組九案例正文" data-link-desc="雲端服務商實戰案例庫 — 從 AWS / GCP / Azure 公開案例整理高併發、峰值流量與容量規劃實踐">9.C2 / 9.C4 / 9.C7 / 9.C28</a>（event）/ <a href="/blog/backend/09-performance-capacity/cases/" data-link-title="模組九案例正文" data-link-desc="雲端服務商實戰案例庫 — 從 AWS / GCP / Azure 公開案例整理高併發、峰值流量與容量規劃實踐">9.C15 / 9.C16 / 9.C17</a>（flash-sale）/ <a href="/blog/backend/09-performance-capacity/cases/" data-link-title="模組九案例正文" data-link-desc="雲端服務商實戰案例庫 — 從 AWS / GCP / Azure 公開案例整理高併發、峰值流量與容量規劃實踐">9.C8 / 9.C18</a>（surge）。</p>
<h2 id="t-90--t-0-準備時程">T-90 → T-0 準備時程</h2>
<p>可預期極端峰值的完整準備時程：</p>
<p><strong>T-90 天</strong>：流量 forecast + 容量計畫敲定。確認預期峰值倍數、確認 headroom 比例、確認跨 region / AZ 分布。產出 <em>容量計畫文件</em>。</p>
<p><strong>T-30 天</strong>：基礎設施 quota 申請。雲端 instance limit、connection pool、API rate limit、DynamoDB throughput、Lambda concurrency 都要 <em>提前申請</em>、不能事件當天才發現 quota 不夠。AWS Infrastructure Event Management（IEM）等服務在這階段啟動。</p>
<p><strong>T-14 天</strong>：第一輪 production-like 壓測。驗證容量計畫是否真的能撐預期峰值、找出第一輪 bottleneck。</p>
<p><strong>T-7 天</strong>：完整 game day 演練。注入故障場景（DB failure、AZ outage、第三方 quota 耗盡）、驗證降級、failover、rollback 流程。修正最後問題、更新 runbook。</p>
<p><strong>T-2 天</strong>：pre-scaling 開始。CDN cache pre-warm、Lambda provisioned concurrency 啟動、autoscaler scheduled 開始、DB capacity 預先 scale up。避免事件當天還在 boot。</p>
<p><strong>T-0 day</strong>：watch room 待命、runbook 開機可執行。所有相關 oncall 跨團隊聯合 channel、dashboard 集中、escalation path 清楚。</p>
<p><strong>T+7 天</strong>：retro。對比預測 vs 實際、紀錄 incident 跟 near-miss、列下個事件要改的事。寫進 <a href="/blog/backend/06-reliability/cases/" data-link-title="可靠性服務案例庫" data-link-desc="按服務組織的 SRE 實踐案例庫，累積架構脈絡與工程文化">06 cases</a> 或本模組 cases。</p>
<h2 id="pre-scaling-策略">Pre-scaling 策略</h2>
<p>T-2 階段的 pre-scaling 是「不依賴 autoscaler 反應」的容量保險。</p>
<p><strong>Pre-scaling 涵蓋層次</strong>：</p>
<ul>
<li><strong>ELB warm-up</strong>：請 AWS 預先 warm up ELB，避免流量上來時 ELB 自身需要時間擴容</li>
<li><strong>Lambda provisioned concurrency</strong>：預先 boot 一定數量 instance、避免 cold start</li>
<li><strong>DynamoDB / Cosmos DB capacity</strong>：scheduled 提前 scale up</li>
<li><strong>EC2 ASG</strong>：min instances 提前拉高</li>
<li><strong>CDN cache pre-warm</strong>：重要 URL 提前 invalidate / pre-populate</li>
<li><strong>DB connection pool</strong>：應用層提前 warm up connection</li>
<li><strong>Cache warmup</strong>：把 hot key 提前 populate 進 cache</li>
</ul>
<p><strong>Pre-warm window 通常 30 分鐘到 2 小時</strong>、取決於：</p>
<ul>
<li>Instance boot time（VM-based 慢、container 快）</li>
<li>Cache warmup 時間（cold cache 命中率低、要時間 populate）</li>
<li>Connection pool 預熱（DB connection establish 有 latency）</li>
</ul>
<h3 id="cdn-pre-warm-操作細節">CDN Pre-warm 操作細節</h3>
<p>CDN pre-warm 在 T-2 階段是 high-impact 操作、但跟其他 pre-scaling 的特性不同。具體做法：</p>
<ul>
<li><strong>找出活動會大量被讀取的 URL 清單</strong>：商品頁、活動 landing page、新 release 內容</li>
<li><strong>在每個 CDN edge POP 觸發 cache populate</strong>：可以用 vendor warmup API（Cloudflare Argo、Fastly Image Optimizer pre-fetch、Akamai NetStorage push），或從多個 region 發 synthetic request 強制 edge 拉取</li>
<li><strong>驗證 hit ratio 已升高</strong>：用 vendor dashboard 觀察 cache_status=HIT 比例、確認 pre-warm 生效</li>
<li><strong>預估 origin 流量曲線</strong>：pre-warm 完成後、活動開始時 edge miss 流量應該大幅降低、origin 容量規劃可以對應放鬆</li>
</ul>
<p>跟其他 pre-scaling 不同的是 <strong>CDN pre-warm 沒有「容量上限」這個概念</strong> — edge cache 是被動填的、warm 完就是 warm、不像 EC2 / Lambda 那樣需要 reserve 容量。風險不在「填不夠」、在「填錯」（key 不對、TTL 設錯讓 pre-warm 立刻過期）。詳見 <a href="/blog/backend/05-deployment-platform/edge-cdn-static-distribution/" data-link-title="5.9 邊緣分發與靜態資源（CDN / Origin Protection）" data-link-desc="整理 CDN 與 edge cache 在部署平台中的責任邊界、origin protection、purge 與 invalidation 策略">5.9 邊緣分發</a> 的 purge 與 cacheable 判讀。</p>
<p><strong>事件結束後也要 <em>scheduled scale down</em></strong>：autoscaler 通常 scale up 快、scale down 慢、長期 over-provision 浪費錢。</p>
<p>對應案例：<a href="/blog/backend/09-performance-capacity/cases/tixcraft-ticketing-flash-sale-spike/" data-link-title="9.C15 拓元 Tixcraft：售票搶購的瞬間爆量架構" data-link-desc="拓元用 DynamoDB 當寫入緩衝 &#43; 傳統伺服器當慢速消費者、承受 100K&#43; 同時選位 &#43; 30 秒從 6 台擴到 800 台">Tixcraft 30 分鐘擴 130 倍</a> — pre-scaling + Auto Scaling Group + AMI prebuild + ELB warmup 組合；<a href="/blog/backend/09-performance-capacity/cases/aws-prime-day-extreme-scale-2025/" data-link-title="9.C1 AWS Prime Day 2025：可預期極端峰值的 dogfood" data-link-desc="Amazon 自家服務在 Prime Day 2025 的峰值數字 — 一年一次可預期峰值的容量設計參考">Prime Day pre-scaling</a> — predictive scaling + scheduled scaling 兩種組合。</p>
<p>詳見 <a href="/blog/backend/knowledge-cards/predictive-scaling/" data-link-title="Predictive Scaling" data-link-desc="說明用歷史模式或 ML 模型預測流量、提前擴容的 autoscaler 模式">Predictive Scaling 卡片</a> 跟 <a href="/blog/backend/knowledge-cards/scheduled-scaling/" data-link-title="Scheduled Scaling" data-link-desc="說明按已知時間表預先擴容的 autoscaler 模式">Scheduled Scaling 卡片</a>。</p>
<h2 id="watch-room-設計">Watch room 設計</h2>
<p>T-0 當天的指揮中心、跨團隊聯合 channel。</p>
<p><strong>人員配置</strong>：</p>
<ul>
<li>跨團隊聯合 channel：app / infra / network / SRE / business / customer support</li>
<li>24/7 輪班（國際事件可能跨 24 小時）</li>
<li>明確 incident commander（<a href="/blog/backend/08-incident-response/incident-command-roles/" data-link-title="8.2 事故指揮與角色分工" data-link-desc="定義 incident commander 與跨角色協作責任">08.7 incident command roles</a>）</li>
</ul>
<p><strong>Dashboard 集中</strong>：</p>
<ul>
<li>流量 dashboard：總 RPS、按 region 拆分、按 endpoint 拆分</li>
<li>延遲 dashboard：p50 / p95 / p99 即時、按 service 拆分</li>
<li>錯誤 dashboard：error rate、按 endpoint、按 status code</li>
<li>成本 dashboard：當前 hourly cost、預估全天 cost</li>
<li>業務 dashboard：訂單數、轉換率、收入</li>
</ul>
<p><strong>Runbook 隨手可用</strong>：常見問題 → 對應動作的明確指引。不要事件當下還在 wiki 找資料。</p>
<p><strong>Escalation path</strong>：什麼狀況找誰、多久升級。寫成決策樹、不要靠人記。對應 <a href="/blog/backend/08-incident-response/incident-command-roles/" data-link-title="8.2 事故指揮與角色分工" data-link-desc="定義 incident commander 與跨角色協作責任">08.7 incident command roles</a>。</p>
<p>對應 <a href="/blog/backend/knowledge-cards/game-day/" data-link-title="Game Day" data-link-desc="說明事故演練如何驗證流程、工具與團隊協作">Game Day 卡片</a>。</p>
<h2 id="vendor-緊急支援">Vendor 緊急支援</h2>
<p>戰略事件可以申請 vendor 工程師待命、是「人力 backup」。</p>
<p><strong>AWS Infrastructure Event Management（IEM）</strong>：年度重大事件可以申請、提供 pre-scaling 與專屬監控通道。
<strong>GCP Customer Reliability Engineering（CRE）</strong>：戰略客戶的 24/7 工程支援、能即時為客戶補容量。
<strong>Azure Premier Support + CSAM</strong>：對等服務。</p>
<p><strong>注意</strong>：這類服務通常綁定 enterprise 等級合約、不是所有客戶都能用。設計事件準備時要假設「沒有 vendor 救援」、vendor 是 bonus 而非 primary plan。</p>
<p>對應案例：<a href="/blog/backend/09-performance-capacity/cases/gr8-tech-ai-predicted-betting-peak/" data-link-title="9.C2 GR8 Tech：AI 預測式自動擴容下的體育博彩高峰" data-link-desc="AI 預測 &#43; EKS 自動擴容怎麼在 25ms p95 下承載 54000 TPS 體育博彩峰值流量">GR8 Tech World Cup IEM</a> — AWS Infrastructure Event Management 在 2022 FIFA World Cup 期間支援；<a href="/blog/backend/09-performance-capacity/cases/niantic-pokemon-go-fifty-x-surge-gcp/" data-link-title="9.C8 Niantic Pokémon GO：在 GCP 上承載 50 倍突發流量" data-link-desc="Pokémon GO 上線時實際流量達原始預估 50 倍、Google CRE 怎麼即時補容量">Pokemon GO CRE</a> — GCP CRE 即時補容量、撐過 50x surge。</p>
<h2 id="game-day-演練">Game day 演練</h2>
<p>T-7 階段的核心活動、把 readiness 從計畫變實戰。</p>
<p><strong>演練場景</strong>：</p>
<ul>
<li>模擬「事件當天 worst case」</li>
<li>注入故障：DB primary failure、AZ outage、第三方 quota 達標、network partition</li>
<li>演練降級：哪些功能關閉、用戶看到什麼</li>
<li>演練 failover：流量切到備援</li>
<li>演練 rollback：發現新版本問題、能不能快速回退</li>
</ul>
<p><strong>Game day 學習目標</strong>：</p>
<ul>
<li>runbook 不夠詳細 → 補</li>
<li>訊號不夠 → 加 metric / alert</li>
<li>人員不夠 → 排班補</li>
<li>工具不夠 → 工程補</li>
</ul>
<p>對應 <a href="/blog/backend/06-reliability/cases/shopify/" data-link-title="Shopify" data-link-desc="Shopify BFCM Scaling / Pod-based Isolation / Capacity Planning">06 cases Shopify game day</a> — Shopify game day 是業界範本、值得直接參考。</p>
<h2 id="event-tier-分級">Event tier 分級</h2>
<p>不同事件規模對應不同準備強度、不能一律照 T-90 流程跑。</p>
<p><strong>Regular event</strong>（每週 promo、small feature launch）：</p>
<ul>
<li>scheduled scaling 即可</li>
<li>無 dedicated watch room</li>
<li>對應 <a href="/blog/backend/06-reliability/release-gate/" data-link-title="6.8 Release Gate 與變更節奏" data-link-desc="把驗證、migration、相容性納入放行判準">06.8 release gate</a> 的常規 release</li>
</ul>
<p><strong>Major event</strong>（季度行銷、新功能發布）：</p>
<ul>
<li>pre-scaling + watch room</li>
<li>簡化版 T-14 → T-0 流程</li>
<li>跨 team coordination</li>
</ul>
<p><strong>Critical event</strong>（年度大促、Super Bowl、IPL）：</p>
<ul>
<li>完整 T-90 流程</li>
<li>vendor IEM + game day</li>
<li>24/7 watch room</li>
<li>C-level visibility</li>
</ul>
<p>對應案例：<a href="/blog/backend/09-performance-capacity/cases/fanduel-dual-peak-betting-streaming/" data-link-title="9.C28 FanDuel：體育直播 &#43; 投注的雙重峰值" data-link-desc="FanDuel 3.5M MAU、Super Bowl 期間擴容 5-10 倍、用 AWS Local Zones &#43; Wavelength &#43; Outposts 處理 20&#43; 州的雙重峰值">FanDuel</a> regular game → playoff → Super Bowl 三 tier — NFL 賽季 baseline → playoffs 升 2-3x → championship 升 4-5x → Super Bowl 升 5-10x、每 tier 對應不同準備強度。</p>
<h2 id="事後-retro">事後 retro</h2>
<p>T+7 retro 是讓 readiness 持續改進的關鍵。</p>
<p><strong>Retro 必答的問題</strong>：</p>
<ul>
<li>流量 forecast 跟實際差多少？（forecast 改進方向）</li>
<li>容量 utilization 峰值多少？（headroom 是否合適）</li>
<li>有沒有 incident 跟 near-miss？（runbook 更新方向）</li>
<li>下個事件要改的事是什麼？</li>
</ul>
<p><strong>Retro 產出</strong>：</p>
<ul>
<li>forecast 改進建議（給 <a href="/blog/backend/09-performance-capacity/capacity-planning/" data-link-title="9.6 容量規劃模型" data-link-desc="peak forecast、headroom budget、growth curve、autoscaling sizing">9.6</a>）</li>
<li>新 runbook 或 runbook 更新</li>
<li>新 monitoring / alert</li>
<li>新工程任務（補容量、補工具）</li>
</ul>
<p>對應 <a href="/blog/backend/08-incident-response/post-incident-review/" data-link-title="8.5 復盤與改進追蹤" data-link-desc="把 RCA 與 action items 轉成可驗證閉環">08.13 post-incident review</a> — retro 不只用在 incident、event readiness 也需要。</p>
<h2 id="案例對照">案例對照</h2>
<table>
  <thead>
      <tr>
          <th>案例</th>
          <th>教學重點</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td><a href="/blog/backend/09-performance-capacity/cases/aws-prime-day-extreme-scale-2025/" data-link-title="9.C1 AWS Prime Day 2025：可預期極端峰值的 dogfood" data-link-desc="Amazon 自家服務在 Prime Day 2025 的峰值數字 — 一年一次可預期峰值的容量設計參考">9.C1 Prime Day</a></td>
          <td>可預期極端峰值教科書範本</td>
      </tr>
      <tr>
          <td><a href="/blog/backend/09-performance-capacity/cases/tixcraft-ticketing-flash-sale-spike/" data-link-title="9.C15 拓元 Tixcraft：售票搶購的瞬間爆量架構" data-link-desc="拓元用 DynamoDB 當寫入緩衝 &#43; 傳統伺服器當慢速消費者、承受 100K&#43; 同時選位 &#43; 30 秒從 6 台擴到 800 台">9.C15 Tixcraft</a></td>
          <td>flash-sale T-2 pre-scaling</td>
      </tr>
      <tr>
          <td><a href="/blog/backend/09-performance-capacity/cases/hotstar-ipl-eighteen-million-concurrent/" data-link-title="9.C13 Disney&#43; Hotstar：IPL 板球決賽 1860 萬人同時直播" data-link-desc="Hotstar 在 IPL 板球決賽創下 1860 萬同時觀看的全球直播紀錄、CDN 與全球邊緣容量極限">9.C13 Hotstar IPL</a></td>
          <td>全球直播 watch room</td>
      </tr>
      <tr>
          <td><a href="/blog/backend/09-performance-capacity/cases/gr8-tech-ai-predicted-betting-peak/" data-link-title="9.C2 GR8 Tech：AI 預測式自動擴容下的體育博彩高峰" data-link-desc="AI 預測 &#43; EKS 自動擴容怎麼在 25ms p95 下承載 54000 TPS 體育博彩峰值流量">9.C2 GR8 Tech</a></td>
          <td>AWS IEM + 自家 AI 預測組合</td>
      </tr>
      <tr>
          <td><a href="/blog/backend/09-performance-capacity/cases/fanduel-dual-peak-betting-streaming/" data-link-title="9.C28 FanDuel：體育直播 &#43; 投注的雙重峰值" data-link-desc="FanDuel 3.5M MAU、Super Bowl 期間擴容 5-10 倍、用 AWS Local Zones &#43; Wavelength &#43; Outposts 處理 20&#43; 州的雙重峰值">9.C28 FanDuel</a></td>
          <td>event tier 分級（playoff → SB）</td>
      </tr>
      <tr>
          <td><a href="/blog/backend/09-performance-capacity/cases/niantic-pokemon-go-fifty-x-surge-gcp/" data-link-title="9.C8 Niantic Pokémon GO：在 GCP 上承載 50 倍突發流量" data-link-desc="Pokémon GO 上線時實際流量達原始預估 50 倍、Google CRE 怎麼即時補容量">9.C8 Pokemon GO</a></td>
          <td>surge 場景的 vendor 救援（CRE）</td>
      </tr>
  </tbody>
</table>
<h2 id="下一步路由">下一步路由</h2>
<ul>
<li>上游：<a href="/blog/backend/09-performance-capacity/capacity-planning/" data-link-title="9.6 容量規劃模型" data-link-desc="peak forecast、headroom budget、growth curve、autoscaling sizing">9.6 容量規劃模型</a> / <a href="/blog/backend/09-performance-capacity/production-validation/" data-link-title="9.10 Production-Side 驗證" data-link-desc="shadow traffic、dark launch、canary、production-like load test">9.10 Production-Side 驗證</a></li>
<li>上游：<a href="/blog/backend/09-performance-capacity/scaling-axes/" data-link-title="9.13 擴展軸與 Stateless 前提" data-link-desc="整理垂直 / 水平擴展取捨、stateless vs stateful 前提、auto scaling 操作模型與兩種擴展的 hidden cost">9.13 擴展軸</a>（pre-scaling 前要分辨可不可水平擴展）</li>
<li>跨模組：<a href="/blog/backend/05-deployment-platform/edge-cdn-static-distribution/" data-link-title="5.9 邊緣分發與靜態資源（CDN / Origin Protection）" data-link-desc="整理 CDN 與 edge cache 在部署平台中的責任邊界、origin protection、purge 與 invalidation 策略">5.9 邊緣分發與靜態資源</a>（CDN pre-warm / origin protection 是 T-2 核心）</li>
<li>跨模組：<a href="/blog/backend/06-reliability/experiment-safety-boundary/" data-link-title="6.20 Experiment Safety Boundary" data-link-desc="定義 chaos、load test、DR drill 的 [blast radius](/backend/knowledge-cards/blast-radius/)、停止條件與權限約束">06.20 experiment safety boundary</a> / <a href="/blog/backend/08-incident-response/" data-link-title="模組八：事故處理與復盤" data-link-desc="用 IR 領域詞彙建問題節點、以服務級案例庫累積事故脈絡，先建概念與案例庫再進實作交接">08 事故處理模組</a></li>
</ul>
<h2 id="既建知識卡片">既建知識卡片</h2>
<ul>
<li><a href="/blog/backend/knowledge-cards/predictive-scaling/" data-link-title="Predictive Scaling" data-link-desc="說明用歷史模式或 ML 模型預測流量、提前擴容的 autoscaler 模式">Predictive Scaling</a></li>
<li><a href="/blog/backend/knowledge-cards/scheduled-scaling/" data-link-title="Scheduled Scaling" data-link-desc="說明按已知時間表預先擴容的 autoscaler 模式">Scheduled Scaling</a></li>
<li><a href="/blog/backend/knowledge-cards/game-day/" data-link-title="Game Day" data-link-desc="說明事故演練如何驗證流程、工具與團隊協作">Game Day</a></li>
<li><a href="/blog/backend/knowledge-cards/peak-forecast/" data-link-title="Peak Forecast" data-link-desc="說明預期峰值流量的預測方法 — 容量規劃的第一個輸入">Peak Forecast</a></li>
<li><a href="/blog/backend/knowledge-cards/headroom-budget/" data-link-title="Headroom Budget" data-link-desc="說明容量規劃中為應付異常 burst &#43; AZ 故障 &#43; forecast 誤差的安全餘量">Headroom Budget</a></li>
</ul>
]]></content:encoded></item></channel></rss>