"Context-Window"
- Context Budget Coding agent 的 context window 拆分配額:system prompt + tool schema + history + file content + reasoning + tool result 各佔多少、留多少 margin
- 5.2 KV cache 量化策略 PC 場景用 K=Q8 / V=Q4 等量化把 KV cache 壓縮、騰出 VRAM 開大 context window 或加併發數的判讀