Kv on Tarragon

DynamoDB

Wed, 13 May 2026 00:00:00 +0000

DynamoDB 是 AWS managed key-value store、用 partition-based scaling 提供 可預測 P99 latency 跟 elastic capacity。Amazon 自家 Ads（9000 萬 RPS）、Disney+、Zoom（COVID 30x surge）、Capcom（billions of requests / single-digit ms）都用 DynamoDB 撐核心 workload — 它是目前公開 case 最多、最被驗證的 managed KV 服務。

教學路線：Access pattern 與 partition capacity

DynamoDB 服務頁的教學目標是把 access pattern 轉成 partition key、sort key、GSI、capacity mode 與 global tables 的設計判斷。讀者讀完後要能從查詢路徑反推資料模型，並估算 hot partition、成本與 consistency trade-off。

學習段	核心問題	對應段落
Access pattern	查詢形狀如何先於資料表設計	定位、適用場景
Partition key	hot partition、single-digit latency、GSI 如何成為設計核心	容量規劃要點、常見陷阱
Capacity mode	on-demand、provisioned、auto scaling 如何對應高峰與成本	容量特性、案例對照
Global tables	multi-region availability 與 consistency 會付出哪些代價	適用場景、跟其他 vendor 的取捨
替代路由	何時回 SQL、MongoDB、Cosmos DB 或 cache / queue	不適用場景、下一步路由

定位：partition-based KV scale

DynamoDB 的核心設計是「partition 透明、capacity 抽象化」。不像 MongoDB 要主動 shard、不像 Cassandra 要管 ring topology、不像 PostgreSQL 要選 instance type — DynamoDB 把所有底層 scaling 隱藏在 RCU / WCU 抽象層後。

容量單位：

1 RCU（Read Capacity Unit）= 1 strongly consistent read of 4KB / sec、2 eventually consistent reads
1 WCU（Write Capacity Unit）= 1 write of 1KB / sec
每個 partition 上限：3000 RCU / 1000 WCU
總容量 = partition 數量 × 每 partition 上限（partition 數量透明、vendor 自動管理）

延遲特性：

single-digit millisecond p99 latency（read / write）
同 region 跨 AZ replication 內建、預設 eventually consistent reads
strongly consistent reads 依 region 內 quorum 成立，跨 region 讀寫要看 Global Tables 語意

詳見 1.10 KV / Document DB 容量規劃跟 9.4 Saturation Discovery 的 partition 設計章節。

適用場景

按公開 case 提煉的典型適用場景：

1. KV / single-table design 為主的查詢：

用 partition key + sort key 設計、單筆 / 範圍查詢
查詢路徑固定，JOIN / ad-hoc query 需求低
對應案例：9.C5 Amazon Ads — 9000 萬 reads/sec + 500 萬 writes/sec、99.999% 可用

2. 可預測 sub-10ms p99 latency 需求：

遊戲後端（玩家狀態、戰績）
內容平台 metadata（watchlist、播放進度）
對應案例：9.C19 Capcom（billions of requests / single-digit ms）、9.C27 Disney+（每日數十億 actions）

3. 流量 spiky 或 surge 場景：

on-demand capacity 自動吸收 burst
不需 connection pool（HTTP API、無 stateful connection）
對應案例：9.C18 Zoom（COVID 1000 萬 → 3 億 DAU）、9.C15 Tixcraft（IOPS 20 → 135K、售票搶購）、9.C29 Lemino（RDB connection limit → 改 DynamoDB）

4. 大規模通知 / 訊息系統：

TTL 自動清理過期 records
partition key 用 user_id / message_id 天然均勻
對應案例：9.C26 PayPay（行動支付每日 3 億訊息）

5. 5 個 9 可用性 B2B SaaS：

multi-region Global Tables active-active
對應案例：9.C24 Genesys（99.999% 跨 15 region）

6. 高吞吐 budget 敏感：

on-demand 適合突發、provisioned 適合 sustained
對應案例：9.C20 Zomato — TiDB over-provision 壓力轉成 DynamoDB on-demand pay-per-use，成本下降 50%

不適用場景

1. 複雜 ad-hoc query / JOIN：

DynamoDB query 以 partition key + sort key 為主，JOIN-heavy workload 交給 SQL 系統
PartiQL 提供 SQL-like 語法但底層還是 KV、複雜 query 會 scan 全表
替代：用 Aurora / PostgreSQL / Spanner

2. 強一致 multi-row transaction：

DynamoDB Transaction 支援 25 個 item 的 ACID
超過 25 個 item 或跨 region 的 transaction 要改用 workflow / SQL / distributed SQL 設計
替代：Spanner / Aurora DSQL / CockroachDB

3. 跨雲需求：

DynamoDB only on AWS、vendor lock-in
替代：Cosmos DB（Azure global NoSQL）、自管 ScyllaDB

4. 大物件 / 文件儲存：

單一 item 最大 400KB
大物件用 S3、metadata 用 DynamoDB

5. 預算極度敏感 + 流量穩定：

流量高度 predictable 的 sustained workload，自管 PostgreSQL / MySQL 可能更便宜
DynamoDB 的 managed 跟 elastic 是有溢價的

跟其他 vendor 的取捨

vs MongoDB（自管或 Atlas）：

DynamoDB：managed、partition 透明、application 主要管理 partition key，有 5 個 9 SLA
MongoDB：彈性高、可自管、aggregation pipeline 強、跨雲可用
選 DynamoDB：AWS-only、想轉移 operation、partition 設計簡單可預測
選 MongoDB：跨雲、複雜 query、ad-hoc analysis

vs Aurora（同 AWS）：

DynamoDB：KV、partition 擴展、無 connection pool 限制
Aurora：SQL（PostgreSQL / MySQL）、有 transaction、ad-hoc query
詳見 1.10 KV / Document DB 容量規劃跟 9.C29 Lemino case — connection limit 是 RDB vs DynamoDB 的關鍵差異

vs Redis（含 ElastiCache）作為 KV 替代：

DynamoDB：持久化、單 item 持久查得到、有 TTL 但物件不會自動失蹤
Redis：純記憶體、預設不持久（MemoryDB 例外）、快但易失
選 DynamoDB：data 是 source of truth，需要持久保存
選 Redis：data 是 cache、丟了能 recompute

vs Cosmos DB（cross-cloud）：

DynamoDB：AWS-only、KV 為主、無 multi-model
Cosmos DB：Azure-only、multi-model（SQL / Mongo / Cassandra / Gremlin / Table）、5 個 consistency levels
選 DynamoDB：AWS 生態、KV 純粹
選 Cosmos DB：Azure 生態、需要 multi-model、需要 multi-region active-active write

vs Cassandra / ScyllaDB（self-managed）：

DynamoDB：managed、5 個 9 SLA、無 ops 負擔
Cassandra / ScyllaDB：可自管、更深 tuning、跨雲可用
選 DynamoDB：團隊想把 DBA / SRE 操作責任交給 AWS
選 Cassandra / ScyllaDB：有 DBA、想 lock-in 風險低、需要極限 throughput tuning

vs PostgreSQL（SQL baseline）：

詳見 PostgreSQL vendor page 取捨段、跟 1.10 KV / Document DB 容量規劃的 connection model 對比
摘要：DynamoDB 是 access pattern 固定 + 需要避免 connection-bound 的選項；ad-hoc query / 複雜 transaction 留 PostgreSQL

容量規劃要點

從 09 案例庫提煉的 DynamoDB 容量規劃實踐：

1. partition key 設計是命脈：

partition key 不均 → hot partition → 名義容量達不到
composite key（event_id + user_id_hash）強制分散
對應 9.C5 Amazon Ads 9000 萬 RPS 靠 partition 均勻、9.C15 Tixcraft 用 composite key 分散售票流量
詳見 Hot Partition 卡片

2. on-demand vs provisioned 選型：

流量 peak/avg > 5x → on-demand
sustained predictable → provisioned + auto-scaling
知名大事件（Black Friday）→ provisioned baseline + scheduled scale-up
對應 9.C20 Zomato — on-demand 解放 over-provisioning

3. Global Tables（multi-region active-active）：

每個 region 都能寫、conflict resolution 用 LWW
容量在每個 region 獨立配置，全球總和要按 region 分別估算
對應 9.C24 Genesys — 15 region 達 5 個 9 可用

4. DAX（DynamoDB Accelerator）：

DynamoDB 前置 in-memory cache
從 single-digit ms 降到 microsecond
適合超高 read 重複的 workload（同樣 key 大量讀）
對應 9.C29 Lemino 用 DAX 加速

5. Streams + Lambda：

DynamoDB 寫入 → Stream event → Lambda 處理
適合 CDC、event-driven 工作流
對應 9.C15 Tixcraft 用 Stream 把 DynamoDB 當 durable queue 給 legacy server 消費

Anti-recommendation 與升級路由

DynamoDB 的 managed elasticity 會讓團隊忽略 access pattern 的前置成本。這一段先說何時維持單純 table / index，再說何時升級到 Global Tables、DAX、Streams、或改回 SQL / document DB。

機制 / 路線	維持簡單設計的條件	升級訊號	主要引用路徑
單 table / 少量 GSI	access pattern 穩定、partition key 均勻、query 成本可預測	新查詢路徑大量增加、GSI 成本壓過主表、hot partition 出現	Hot Partition、Workload Model
On-demand capacity	peak/avg 差距大、流量有事件性 surge	sustained traffic 穩定、成本曲線可預測	Peak Forecast、Cost Per Request
Provisioned + autoscaling	baseline 穩定、團隊能預測高峰	黑五、售票、直播等已知大事件需要預先升配	Scheduled Scaling
DAX	read 重複率低、single-digit ms 已足夠	同 key 超高讀取、需要 microsecond read	Cache Aside、Stale Data
Global Tables	single-region availability 已足夠	RTO/RPO、region residency 或 active-active write 是產品需求	RTO、RPO、Consistency Level
SQL / document DB	access pattern 可提前列舉	ad-hoc query、JOIN、multi-row transaction 或 document traversal 成主題	Aurora vendor、MongoDB vendor

DynamoDB 的簡單路徑是先把每個 query path 寫成契約。table、partition key、sort key、GSI 與 TTL 都應從 access pattern 反推；如果需求仍在探索期，PostgreSQL 或 MongoDB 可能提供更低的變更成本。

Global Tables 的升級路徑要先處理 conflict 與讀寫語意。它提供 multi-region availability，但 LWW conflict resolution、region-local capacity 與跨 region reconciliation 仍要由 application contract 承擔。

Deep article（已完成）

本 vendor 現有 deep article 覆蓋 DynamoDB 從 access pattern 反推到寫一致性、讀加速、事件驅動與資料生命週期的核心 production 議題：

主題	文章	對應 production 議題
適用度 4 軸前置判讀 + access pattern 反推 PK/SK + durable queue	single-table-design-pattern	適用度判讀 + control plane vs data plane + 9.C15 Tixcraft Stream durable queue
1000 WCU partition 上限 + composite key / calculated shard 修法	partition-key-antipatterns	9.C15 Tixcraft 6750x 擴展、mode × partition 在 provisioned / on-demand 表現
GSI / LSI projection 三型、sparse、DAX 補位	gsi-lsi-design	GSI 自己會 hot partition、Capcom derive vs Lemino case fact 分層
6 軸 capacity mode 決策 + auto-scaling 邊界 + cost crossover	on-demand-vs-provisioned	Zomato 50% 成本下降、Zoom 30x permanent surge、Amazon Ads sustained workload
Multi-region active-active + LWW conflict + cross-device sync	global-tables-conflict	Genesys 99.999% / 15 region、Disney+ 跨裝置同步
Strongly / eventually consistent read 取捨	consistency-model-optimization	read consistency 成本選擇
跨 item 原子性 + conditional write + optimistic lock + idempotency	transactions-conditional-writes	雙寫不一致、超賣 race、transaction 2x 成本邊界
DAX cluster + item/query cache + write-through + invalidation 邊界	dax-caching-strategy	讀峰值 p99 尖刺、query cache 只靠 TTL 失效、strong read 繞過 cache
Streams CDC + shard 順序 + Lambda 消費 + 失敗處理	streams-lambda-event-driven	下游即時反應、at-least-once 冪等、毒丸 record 隔離
TTL 自動過期 + 48h 刪除延遲 + 過期仍可讀 + storage 成本	ttl-data-lifecycle	9.C26 PayPay 每日上億訊息 storage 清理、過期未刪 item 讀取陷阱

Migration playbook：從 RDS / MongoDB 遷移到 DynamoDB（Type E paradigm shift、access-pattern-first 重建模 + 混合架構 + Zomato cost crossover）。

跨 vendor entry：先看 DB3 vendor selection（MongoDB / DynamoDB / Cosmos DB 三方選型 + workload shape 前置判讀），再進本 vendor 的 deep article。

後續擴充（仍待補）

DynamoDB Streams 進階 lab：Kinesis Data Streams for DynamoDB 多消費者 fan-out 與長 retention 重播（Lambda vs Kinesis 比較層已在 streams-lambda-event-driven 覆蓋、此處指可操作的深度 hands-on lab）
Export to S3 / point-in-time export 做離線分析
DynamoDB → SQL / search / analytics split（遷出方向 playbook）
Backup / PITR restore drill（hands-on lab）

案例對照

案例	規模	教學重點
9.C5 Amazon Ads	9000 萬 RPS + 500 萬 WPS	partition 均勻設計典範
9.C15 Tixcraft	IOPS 20 → 135K（6750x 擴展）	flash-sale 緩衝模式
9.C18 Zoom	30x DAU surge（1000 萬 → 3 億）	SaaS surge baseline 重新校準
9.C19 Capcom	billions of requests / single-digit ms	遊戲後端 KV、跨遊戲共用平台
9.C20 Zomato	4x 吞吐、90% latency 降、50% 成本降	TiDB → DynamoDB cross-DB 遷移
9.C24 Genesys	99.999% / 15 region / 8000+ orgs	B2B SaaS 5 個 9 可用性
9.C26 PayPay	3 億訊息 / 天	行動支付通知系統、TTL 自動清理
9.C27 Disney+	每日數十億 actions	串流 metadata 層 + cross-device 同步
9.C29 Lemino	tens of thousands req/sec、5M MAU / 3 月	RDB connection limit → DynamoDB

DynamoDB case 的讀法是先分類 access pattern，再看容量模式。Amazon Ads / Capcom / Disney+ 說明高吞吐 KV，Zoom / Tixcraft / Lemino 說明 surge 與 connection-free scaling，Zomato 則說明 on-demand cost model 如何改變 over-provision 壓力。

反向 sibling 路由

DynamoDB 的反向 sibling 路由用來把 RDBMS 退場條件寫清楚。若讀者從 PostgreSQL / MySQL 的 connection bottleneck 過來，先讀 Lemino case 與 1.10 KV / Document DB 容量規劃；若需求仍需要 ad hoc SQL、join 與 transaction report，回 Aurora vendor 或 PostgreSQL vendor；若需求是 global document model 與 Azure 生態，再對照 Cosmos DB vendor。

這條路由的判準是 access pattern 是否穩定到可以先設計 key。DynamoDB 擅長固定 lookup、寫入尖峰、connection-free scaling 與 TTL 類生命週期；資料探索、報表 join 與多條件查詢仍應留在 SQL / search / analytics service。

常見陷阱

從公開 incident 跟 case 提煉：

partition key 集中：event_id 一個演唱會、bot user 大量同 user_id 寫入 → 用 composite key 或 write sharding
單一 partition 達 3000 RCU / 1000 WCU 上限：throttling event 出現、即使整體 capacity 還沒滿
Scan 全表：scan 會吃光 capacity，正式讀取路徑應回到 query / index design
DAX 跟 DynamoDB 直連混用：寫入直連 DynamoDB、讀經過 DAX → cache 一致性問題
Global Tables conflict：跨 region 同 key 同時被寫、LWW 可能丟失寫入、要設計 idempotency

下一步路由

完整 T1 對照：01-database vendors index
平行：Aurora vendor page（SQL 對比）
上游：1.10 KV / Document DB 容量規劃
下游：1.12 大規模 DB 遷移實戰（從 RDBMS 遷 DynamoDB 案例）
跨模組：9.4 Saturation Discovery、9.6 容量規劃模型
Last reviewed：2026-05-22（capacity mode / Global Tables / best practices 屬時間敏感 claim）
官方：Amazon DynamoDB Customers、DynamoDB 設計 best practices

1.10 KV / Document DB 容量規劃

Wed, 13 May 2026 00:00:00 +0000

概念定位

KV / Document DB 的容量規劃跟傳統 OLTP 完全不同。OLTP 容量靠「instance type 升級 + read replica」、KV 靠「partition 切分 + capacity unit 配置」。兩者瓶頸不同、可擴範圍不同、設計取捨也不同。

本章針對 DynamoDB、Azure Cosmos DB、Google Cloud Bigtable、MongoDB Atlas 等主流 KV / Document DB、整理容量規劃的共通方法論。讀完後讀者能回答：partition key 怎麼設計才不會 hot partition、on-demand vs provisioned 怎麼選、什麼時候從 single-region 升到 multi-region。

跟 1.1 高併發資料存取的關係：1.1 處理 OLTP 高併發、本章處理 KV 高併發。兩者讀者群有重疊但解法不同。

跟 9.4 Saturation Discovery 跟 9.6 容量規劃模型的關係：本章從 DB 視角 看容量、9.4 / 9.6 從 workload 視角 看容量、兩者互補。

KV / Document DB 的容量模型

KV 容量模型可以簡化成一條公式：總容量 = partition 數量 × 每 partition 上限。

vendor 不同、細節不同，但都遵循這個邏輯。

HTTP API DB vs connection-based DB 的本質差異

KV DB 在 surge 場景比 OLTP 有結構性優勢的主因、不只是 partition 設計、是 連線模型 的本質差異。

Connection-based DB（PostgreSQL、MySQL、MongoDB、Cassandra）：

用戶端跟 DB 維持 TCP connection、connection 有 state（authenticated session）
每個 connection 在 DB server 端佔記憶體 + 一個 process/thread
connection 上限通常 1K-5K
application 想開更多 connection、DB 直接拒絕

HTTP API DB（DynamoDB、Cosmos DB、Bigtable、Firestore）：

用戶端每次 request 開新 HTTP connection（或用 keep-alive 池）
DB 端沒有「per-user connection state」、是 stateless API server
沒有 connection 上限概念、能力上限是 每 partition 的 RU / RCU
application 加多少 instance 都不影響 DB

對應 9.C29 Lemino — NTT DOCOMO 串流服務選 DynamoDB 而非 RDB 的關鍵原因是 RDB 的 connection limit 在 surge 場景變成 bottleneck、HTTP API 模型沒這個問題。

判讀含義：選 KV DB 不只是「擴容容易」、是 連線模型 適合無 state HTTP 服務的天然契合。微服務數量增加時、HTTP API DB 不需要每次都 review connection pool 設定。但若 application 仍以 SQL transaction 為主流程設計、改 KV 需要 改 application 架構、不是換 driver 而已。

Amazon DynamoDB：

容量單位是 RCU（Read Capacity Unit）跟 WCU（Write Capacity Unit）
1 RCU = 1 strongly consistent read of 4KB / sec、2 eventually consistent reads
1 WCU = 1 write of 1KB / sec
每個 partition 上限：3000 RCU / 1000 WCU、底層 partition 數量透明

Azure Cosmos DB：

容量單位是 RU（Request Unit）— 把 read / write / query 統一抽象
1 RU = strongly consistent read of 1KB document
寫成本約 5x read、複雜 query 可達數百 RU
每個 logical partition 上限：10,000 RU/s

Google Cloud Bigtable：

容量單位是 node（SSD / HDD）
每個 node 約 10,000 reads/sec、10,000 writes/sec（依 row size）
partition 透明、靠 tablet 自動分裂

MongoDB Atlas：

容量單位是 cluster tier（M10、M30、M60 等）+ shard
每個 shard 是獨立 mongod replica set、容量按 instance type 跟 storage
主動 sharding 設計、跟 DynamoDB 透明 partition 不同

共通點：容量上限不是「單一 number」、是「partition / shard 數量 × 每 partition 上限」。要擴容、要嘛加 partition、要嘛升級 partition、不能像 OLTP 一樣換更大 instance。

Partition key 設計：容量的命脈

partition key 設計不均勻、實際容量遠低於名義。這是 KV DB 最常見的 production issue。

Hot partition 的成因：

名義容量 = partition 數量 × 每 partition 上限
實際容量 = 最熱 partition 上限（如果分布不均）
100K RPS 名義能撐、若 80% 流量集中在 1 個 partition、實際 只能撐 3K RPS（DynamoDB partition 上限）

識別 hot partition 的訊號：

throughput 上不去、但 average resource utilization 低
某些 key 的 request latency 飆、其他 key 正常
DynamoDB throttling event 出現（即使 capacity 還沒滿）
Cosmos DB 顯示「per-partition RU consumption skew」

設計策略：

天然均勻 partition key：user_id、order_id、device_id 等天然分布廣的 ID。最簡單、最常用。
Composite partition key：把容易集中的維度（event_id）跟均勻的維度（user_id_hash）組合。例如 event_id#user_id_hash_mod_100、強制把同一 event 的流量分散到 100 個 sub-partition。
Write sharding：在 partition key 後加 random suffix。event_id#0 ~ event_id#9 讓同一個 event 變成 10 個 partition。讀的時候要 scatter-gather 從 10 個 partition 讀回來。
Time-bucket：對時序資料、加 minute / hour bucket。metric#2026-05-13-T12、每個時段一個 partition。

對應案例：

9.C5 Amazon Ads — 9000 萬 reads/sec 靠 partition 設計均勻、不是純擴 capacity
9.C15 Tixcraft — 售票 event_id 天然容易 hot、必須用 composite key 或 write sharding 分散
9.C11 Minecraft Earth — Cosmos DB synthetic partition key 強制分散

詳見 Hot Partition 卡片。

彈性來自 partition key 均勻分布

KV DB 的吞吐彈性等於 partition key 均勻分布的結果。partition key 均勻時、總容量 ≈ partition 數量 × 單 partition 上限；partition key 不均時、實際容量 = 最熱 partition 上限（DynamoDB 每 partition 3000 RCU / 1000 WCU）、跟 partition 總數無關。

對應 9.C15 Tixcraft — 售票 IOPS 從 20 衝到 135K 的 6,750 倍彈性、前提是 partition key 把流量分散到大量 partition（合理做法是 composite key event_id + user_id_hash 或 write sharding event_id + random_suffix）。若用裸 event_id 當 partition key、同一場演唱會所有訂單擠進同一個 partition、實際 IOPS 上限被鎖在 1000 WCU、跟 partition 總數無關。

判讀重點：讀「Amazon Ads 9000 萬 reads/sec」、「DynamoDB 1.51 億 RPS」這類數字、要追問「partition 設計是什麼」、再判斷自己的服務能否複製。換 DynamoDB 是必要前提、partition key 設計是充分前提；只換 DB 而沒解決 partition key、會出「換了 DB 但 hot partition 依舊」的事故。

Capacity mode：on-demand vs provisioned

DynamoDB / Cosmos DB 都提供兩種容量模式、各有適用場景。

On-demand（pay-per-use）：

不需事前配置 RCU / WCU / RU
自動 scale up / down、處理突發流量
單位成本高（約 7x provisioned）
適合：流量不可預測、burst 頻繁、開發 / 測試環境

Provisioned（預配置）：

預先訂購 RCU / WCU / RU
超過配額會 throttle（除非開 auto-scaling）
單位成本低
適合：流量可預測、sustained workload、生產環境

選型決策：

場景	建議 mode
流量 peak/avg 比 < 3x	provisioned + auto-scaling
流量 peak/avg 比 > 5x	on-demand
流量極端 bursty（flash-sale）	on-demand
sustained growth 穩定上升	provisioned + scheduled scaling
短期測試 / POC	on-demand
已知大事件（Black Friday）	provisioned baseline + scheduled scale-up

對應案例：

9.C20 Zomato — TiDB 必須長期 over-provision、換 DynamoDB on-demand 後 pay-per-use、50% 成本下降
9.C26 PayPay — sustained 3 億 msg/day 適合 provisioned + auto-scaling
9.C5 Amazon Ads — 9000 萬 RPS sustained workload 必然 provisioned + careful tuning

詳見 9.7 成本邊界與 efficiency 的成本曲線分析。

計費粒度 vs 工程顆粒

KV / Document DB 的計費單位（DynamoDB 的 RCU/WCU、Cosmos DB 的 RU、Spanner 的 processing unit）決定容量規劃可以從多小開始。計費粒度太大、中小規模負載付過多錢；計費粒度太小、大規模負載要管理很多細項。

對應 9.C10 Spanner — Spanner 早期最小單位是 100 processing units（pu）≈ 1 node、對中小負載門檻過高。後來推出 100 pu 起跳的 granular sizing、讓容量規劃可以從小開始、降低 onboarding 門檻。

選型含義：

新服務 / 中小規模：選計費粒度小的選項（Cosmos DB serverless、Spanner granular sizing、DynamoDB on-demand）、避免一開始就為了「未來會用到」過配。中小規模付過配成本、實際就是替「不確定的未來」付保險費、保險費過高代表選錯產品。
穩定大規模：計費粒度可大（DynamoDB provisioned with reserved capacity、Spanner full-node provisioning）、單價較低。Reserved capacity 通常綁 1-3 年合約、要看業務 未來 12-24 月需求是否穩定、若業務量可能下降或遷移、Reserved 反成沉沒成本；若業務量穩定上升、Reserved 是合理 hedging。
POC / 測試：選 on-demand 或 serverless、付實際用量、別為了未實際 production 的 workload 付 reserved 成本。

判讀重點：計費粒度同時是 vendor 商業策略 跟 工程顆粒、選 vendor 時要看 min sizing 跟 增量 granularity、不只看 max throughput。

業務邏輯變化 → 讀寫比跳量級

讀寫比變化是容量規劃的早期警訊、但常被忽略。原始容量規劃通常基於某個讀寫比（例如 1:1 或 5:1）、業務邏輯改變可能讓比例跳一個量級、原容量規劃失效。

對應 9.C5 Amazon Ads — 廣告事件量測讀寫比 18:1（曝光發生 1 次、後續查詢 18 次）。如果業務新增即時報表功能、讀次數從 18 跳到 50、容量規劃要重做、不是「再加一點 capacity」。

常見業務變化導致讀寫比跳量級：

新增即時 dashboard：每筆資料被查詢頻率從 1 次跳到 N 次
新增推薦演算法：每用戶 read profile 從每次登入 1 次變成每次推薦 1 次（× 推薦頻率）
新增 audit / compliance 查詢：每筆敏感資料額外被查 5-10 次
新增 cache：讀次數從 100 降到 5（cache hit rate 95%）— 跟其他變化方向相反、是 capacity 該縮容 的訊號、若沒同步 review 反而會繼續按舊容量付錢
新增 anti-fraud 檢測：每寫入觸發 N 次 read 驗證

判讀重點：容量規劃 review cadence 不只看流量、要 review 讀寫比 是否漂移。比例跳量級是設計需要重做的訊號、不是單純 capacity 增加（或減少）的訊號。

一致性模型：strong vs eventual vs session

KV / Document DB 通常提供多個 consistency level、不同 level 對應不同延遲跟可用性。

DynamoDB：

Eventually consistent reads（預設、便宜）：1 sec 內收斂、cost = 0.5 RCU
Strongly consistent reads：跨 AZ quorum、cost = 1 RCU、不可跨 region
沒有中間 level

Cosmos DB（最豐富）：

Strong：linearizable、跨 region quorum、最高 latency
Bounded staleness：訂上限（時間 / 版本差異）
Session：同一 session 內強一致（最常用）
Consistent prefix：保證寫入順序、不保證收斂時間
Eventual：最便宜、最終一致

Bigtable：

Single-region：strongly consistent
Replicated：eventually consistent

選 consistency level 的工程後果：

Strong consistency → 跨 region 延遲（quorum round-trip）
Eventual → 用戶可能看到舊資料、需要 application 容忍
Session → 大多數網路服務的 sweet spot（用戶看自己寫的東西要立即、別人寫的可以稍晚）

對應案例：

9.C10 Spanner — external consistency（線性化）跨地區、付出 quorum 延遲代價
9.C30 Microsoft 365 Cosmos DB — 分析平台用 weakest consistency 換最大 throughput

詳見 1.3 Transaction Boundary 的一致性取捨。

Multi-model 取捨

部分 KV / Document DB 支援多個 model interface、同一服務跑不同抽象。

Cosmos DB（最廣 multi-model）：

SQL API（document）
MongoDB API（document、wire-protocol compatible）
Cassandra API（wide-column）
Gremlin（graph）
Table（key-value）

DynamoDB（KV + document）：

原生 KV、但 attribute 可以是 nested map / list（document-like）
沒有 SQL interface（PartiQL 是 query language、不是 model）

Bigtable（wide-column）：

沒有 multi-model、純 wide-column
替代方案：用 Spanner + Bigtable 組合

Multi-model 的優缺：

優勢：同一團隊不必管多個 vendor、ops 簡化
優勢：不同 use case 用同一 datastore、減少 data sync
限制：vendor lock-in 加深、難換
限制：每個 API 都不是最好的（compromise）— MongoDB API 跟 native MongoDB 有 behavior 差異

選型建議：

已用 single model → 不必為 multi-model 而換
多種 use case 同時上 → 評估 Cosmos DB（特別是 MongoDB workload + 新需求）
純 KV 高吞吐 → DynamoDB / Bigtable 比 Cosmos DB 通常便宜

對應案例：

9.C30 Microsoft 365 — MongoDB → Cosmos DB MongoDB API、應用層幾乎不改、底層改用 Cosmos 分散式架構
9.C11 Minecraft Earth — 用 SQL API、不需要 MongoDB compat

KV DB 作為寫入緩衝的特殊用法

本節展開 KV 在 flash-sale 架構 的特殊角色、屬於資料層責任、但跟 9.11 高峰事件準備跟 03 訊息佇列模組互補（後者主寫 broker / queue 設計、本節聚焦把 KV 當 buffer 的取捨）。

9.C15 Tixcraft 揭露一個非傳統用法：DynamoDB 不當 OLTP、當 durable queue。

模式：前端把訂單塞進 DynamoDB（高吞吐、partition 均勻）、後端 legacy server 按自己能承受的速度從 DynamoDB 消費。

為什麼用 DynamoDB 而非 SQS / Kafka：

DynamoDB Stream 提供 change data capture、後端可以 stream 消費
寫入後立即可查（OLTP-like）、不是純 fire-and-forget
partition 設計讓單一事件可以分散到多個 partition
同樣 vendor、不必另起一個 broker 服務

適用場景：

突發流量遠超後端處理能力
後端是 legacy、不容易擴
需要寫入後立即可查（用戶看「我下單成功了」）

不適用場景：

純 fire-and-forget（用 SQS 更便宜）
高吞吐 stream processing（用 Kafka 更專業）
順序性嚴格要求（DynamoDB Streams 只在 partition 內保證順序）

詳見 9.C15 Tixcraft 案例的詳細分析。

連線管理：跟 OLTP 完全不同

KV / Document DB 通常是 HTTP / gRPC 介面、不是 connection pool。這是跟 OLTP 完全不同的設計、影響應用層架構。

OLTP（PostgreSQL / MySQL）：

每個 application instance 維護 connection pool（10-100 connections）
connection 是有狀態的（transaction、session variable）
pool size × instance 數量 ≤ DB 上限（PostgreSQL 預設 100、PgBouncer 可破百）
9.C29 Lemino 案例揭露 RDB connection 是隱性 bottleneck

KV（DynamoDB / Cosmos DB）：

純 HTTP / gRPC、無 stateful connection
每個 request 獨立、不必預先 establish connection
沒有 connection limit 概念
應用層擴容不會打爆 DB connection

這個差異是 KV DB 在 surge 場景 比 OLTP 有優勢的主因 — KV 不會 connection saturate。

隱性限流 vs 明確限流

flash-sale 或極端負載場景的限流可能分散在多層元件、不是單一「rate limiter」。同一架構可能同時包含隱性限流（用 DB / LB 上限自然攔截）跟明確限流（用排隊系統精確控速）。

對應 9.C15 Tixcraft — 售票架構圖上看不到明確「rate limiter」元件、但限流發生在多層：

DynamoDB 寫入排隊：DynamoDB 把訂單塞進 queue、傳統 server 按自己能力消費 — DynamoDB throughput 就是隱性限流
ELB max connection：load balancer 上限自動拒絕超量請求
Application 層 connection pool：超過 pool size 的 request 排隊或被拒
付款層獨立：搶票流量塞爆時、付款不受影響、低頻路徑「自然限流」

對比 9.C16 SeatGeek Virtual Waiting Room 的 明確限流：用 Counters table 精確控發 token 速率、用戶看得到排隊位置。

選擇取捨：

維度	隱性限流（Tixcraft）	明確限流（SeatGeek）
用戶體驗	用戶以為成功、實際排隊	用戶看得到等待時間
流量吸收能力	極高（DB 直接吸）	受限於 token 發放速度
開發複雜度	低（用 DB 自帶 throughput）	高（需要 token 系統）
失敗模式	DB 滿了用戶才被拒	排隊系統爆了用戶被拒
適合業務	流量瞬間到頂、要全收	流量持續高、要排序公平

失敗模式延伸：隱性限流的失敗特徵是「provisioned capacity / connection pool 飽和、用戶看到 5xx / timeout、沒人收到排隊位置」— 監控訊號是 DynamoDB throttling event 或 ELB queue length 飆。明確限流的失敗特徵是「排隊系統本身的 DB / counter 飽和、token 發不出來、所有用戶包含 VIP 都被擋」— 監控訊號是 token issuance success rate 掉。兩種失敗對應不同 runbook、混在同一 alert dashboard 會誤判。

適合業務延伸：隱性限流適合「流量瞬間到頂、業務願意接受用戶看不見排隊」的場景（演唱會搶票、Black Friday 開賣瞬間、限量商品）— 業務優先收住流量、用戶體驗可以事後解釋。明確限流適合「流量持續高、用戶等待時間長、需要顯示進度減少跳離」的場景（IPO 開盤、長期熱門商品上架、跨小時的搶購事件）— 用戶能看到「我還有 30 分鐘」會繼續等。

判讀重點：選哪種限流取決於業務願意接受什麼用戶體驗、不是工程偏好。隱性限流用透明度換流量吸收能力、明確限流用流量吸收能力換體驗可見度。兩者並存、沒有「best practice」。

案例對照

案例	教學重點
9.C1 AWS Prime Day 2025	DynamoDB 24 小時 1.51 億 RPS、毫秒級延遲、可預期峰值上限參考
9.C5 Amazon Ads	9000 萬 RPS + 99.999% 可用 — partition 均勻設計典範
9.C11 Minecraft Earth	Cosmos DB 1M RU/s + multi-model + global distribution
9.C15 Tixcraft	DynamoDB 當 durable queue、IOPS 20→135K
9.C16 SeatGeek	DynamoDB 4 表 + Lambda 實作 virtual waiting room、跟 Tixcraft 的隱性緩衝形成姊妹案
9.C18 Zoom	30x DAU surge、DynamoDB 撐 control plane
9.C19 Capcom	遊戲後端 KV、billions of requests + single-digit ms
9.C20 Zomato	TiDB → DynamoDB、50% 成本下降的取捨
9.C21 ASOS	Black Friday 1.67 億請求 / 24h、Cosmos DB 多 region
9.C24 Genesys	99.999% 跨 15 region、DynamoDB 為預設 DB
9.C26 PayPay	3 億訊息 / 天、TTL 自動清理
9.C27 Disney+	billions of actions daily、watchlist + 播放進度
9.C29 Lemino	connection limit 才是 RDB bottleneck、改用 DynamoDB

9.C16 SeatGeek 把 DynamoDB 當 排隊調度系統、不只當 queue buffer：用 Counters table 控發 token 的速率、Queue table 紀錄序號、Connection table 串 WebSocket。這個架構跟 9.C15 Tixcraft 的「全部塞進 DynamoDB 隱性緩衝」是兩種對立取捨 — Tixcraft 用透明度換流量吸收能力、SeatGeek 用流量吸收能力換體驗可見度。判讀重點：KV DB 不只能當 OLTP 替代品、4 張表組合就能變成業務級調度引擎、選表前要先確定業務需要哪一面。

下一步路由

上游：0.2 State Storage Selection — KV vs OLTP vs SearchIndex 選型
平行：1.1 高併發資料存取（OLTP 版本）/ 1.3 Transaction Boundary
下游：1.11 全球分散式 OLTP、1.12 大規模 DB 遷移實戰（含「預設 DB 治理 pattern」— KV 在大規模平台的選型治理）
跨模組：9.4 Saturation Discovery（hot partition 量測）、9.6 容量規劃模型、9.7 成本邊界
DynamoDB 深入：partition key 反模式、on-demand vs provisioned 切換、single-table design、GSI / LSI 設計
Cosmos DB 深入：partition key 設計、RU 成本模型、一致性層次工程
MongoDB 深入：shard key 選型、schema design pattern、connection 管理與 cache 層

Kv on Tarragon

DynamoDB

教學路線：Access pattern 與 partition capacity

定位：partition-based KV scale

適用場景

不適用場景

跟其他 vendor 的取捨

容量規劃要點

Anti-recommendation 與升級路由

Deep article（已完成）

後續擴充（仍待補）

案例對照

反向 sibling 路由

常見陷阱

下一步路由

1.10 KV / Document DB 容量規劃

概念定位

KV / Document DB 的容量模型

HTTP API DB vs connection-based DB 的本質差異

Partition key 設計：容量的命脈

彈性來自 partition key 均勻分布

Capacity mode：on-demand vs provisioned

計費粒度 vs 工程顆粒

業務邏輯變化 → 讀寫比跳量級

一致性模型：strong vs eventual vs session

Multi-model 取捨

KV DB 作為寫入緩衝的特殊用法

連線管理：跟 OLTP 完全不同

隱性限流 vs 明確限流

案例對照

下一步路由

既建知識卡片