0.5 流量與資料量評估

2026-04-23

流量與資料量評估的核心原則是先描述規模形狀，再討論服務能力。平均 QPS、尖峰倍率、資料成長速度、hot key、保留期限與讀寫比例，會直接影響資料庫、快取、queue、觀測與部署平台的選型方向。

本章目標

學完本章後，你將能夠：

容量評估的第一個問題是「壓力如何出現」。同樣是一千個 request，每秒穩定進來、五秒內全部湧入、集中打同一個商品、或每次都查不同使用者，對系統的壓力完全不同。

評估面向	需要回答的問題	常見影響
平均流量	平常每秒有多少 request 或 message	基礎容量與成本
尖峰倍率	尖峰是平均的幾倍，持續多久	buffer、autoscaling、backpressure
讀寫比例	讀多、寫多，還是混合交易	cache、index、transaction 設計
hot key	壓力是否集中在少數 key	cache、sharding、rate limit
資料成長	每天新增多少 row、event 或 object	storage、partition、retention
查詢範圍	查最近資料、全量資料，還是任意條件	index、search、archive
保留期限	資料要留多久，是否需要 audit	cost、lifecycle、compliance

這張表是評估索引。真正的容量討論要把數字放回產品情境，才能知道需要擴充哪種能力。

平均流量的核心用途是估算日常成本與基本容量。穩定 API、背景 worker、資料同步與觀測資料，都需要知道平常每秒會產生多少 request、message、log、metric 或資料寫入。

接近真實網路服務的例子包括：

這類評估的陷阱是只看平均值。平均值能估算基礎成本，但它無法說明尖峰、集中 key、批次匯入或下游失敗時的堆積風險。

尖峰流量的核心用途是估算系統如何吸收短時間壓力。活動開賣、推播通知、直播開始、月底結帳、第三方批次同步，都可能讓流量在短時間內暴增。

接近真實網路服務的例子包括：

這類評估的陷阱是把尖峰當成一般擴容問題。尖峰可能需要 queue、backpressure、cache warmup、rate limit、預先產生 read model 或降級策略；單純加機器未必能保護資料庫、broker 或外部 API。

讀寫比例的核心用途是判斷主要壓力在讀取、寫入還是交易一致性。讀多系統常需要 cache、read model 或搜尋索引；寫多系統則更關心 transaction、batching、queue、idempotency 與資料成長。

接近真實網路服務的例子包括：

這類評估的陷阱是只問資料量。十億筆冷資料和一萬筆每秒被反覆讀寫的熱資料，壓力來源完全不同。讀寫比例要和查詢模式、更新頻率與一致性需求一起看。

hot key 的核心訊號是壓力集中在少數資料上。即使整體 QPS 看起來正常，單一商品、單一直播間、單一聊天室、單一熱門文章或單一 tenant 也可能打爆特定資料路徑。

接近真實網路服務的例子包括：

這類評估的陷阱是只做整體水平擴展。hot key 可能需要資料拆分、topic 分層、快取策略、讀寫分離、限流或產品層降級；具體做法要等需求形狀確認後再進入服務細節。

資料成長評估的核心問題是「今天可用的設計，三個月後是否仍可用」。row、event、log、trace、object、index 都會成長；不同資料還有不同查詢頻率與保留需求。

接近真實網路服務的例子包括：

這類評估的陷阱是把所有資料都放進同一個保存策略。正式狀態、audit、分析事件、debug log、trace、使用者上傳檔案需要不同保留期限、查詢方式與封存策略。

查詢範圍的核心問題是「使用者或系統實際會怎麼找資料」。查最近十筆、查單一 ID、查某個 tenant、查全文、查任意時間範圍與查聚合報表，需要不同資料模型。

接近真實網路服務的例子包括：

這類評估的陷阱是把所有查詢都塞進正式資料庫的單一模型。當查詢體驗、聚合方式或資料保留策略不同時，可能需要 read model、search index、analytics pipeline 或 archive，但這些都應來自明確查詢需求。

當以下問題都能回答時，代表本章的概念層已完成，可以進入容量與成本實作章節：

下一步建議路由：

流量與資料量評估要描述壓力形狀。平均流量估算基礎容量，尖峰流量決定緩衝與降級，讀寫比例影響資料路徑，hot key 會讓平均值失真，資料成長與保留期限決定長期成本，查詢範圍決定索引與讀取模型。這些資訊補齊後，服務選型才會有可靠依據。