結論

Agent team context 隔離是 LLM-era review 工具設計的核心模式 — 用 N 個獨立 reviewer instance 各自跑 background、各自寫 output file、主 context 只接精煉摘要、不被 reviewer 細節污染。

設計面紀律效果
Instance 隔離N 個專責 reviewer 各自獨立 context維度盲點分開處理、不互相干擾
Background 平行不阻塞主 context、可同時跑 3-5 個 reviewer時間從序列 30 分鐘縮到平行 10 分鐘
輸出檔案隔離Reviewer 寫 output file、不污染主 conversation主 context 增量 ~3K token、節省 ~80% context
主 context 只接摘要Reviewer 完成後回傳精煉彙整修正循環時 context 留給判讀、不被 raw issue 列表佔滿

跟 multi-pass review(#83)的差別:#83 是 同一 reviewer 換輪次 frame(生成 / 對意圖 / 機會成本 / grep / 反例);本卡是 不同 reviewer instance 各自獨立(規範 / 案例準確 / 跨章一致 / compositional-writing 等)。兩者正交、可疊加。


跟 multi-pass review 的差別

維度#83 Multi-pass review#121 Agent team context 隔離(本卡)
軸定位Frame 軸(一個 reviewer N 輪不同 frame)Instance 軸(N 個 reviewer 各自獨立)
解決問題Working memory 限制(一輪 catch 不到所有層)Context 污染(單一 reviewer context 被 raw input 佔滿)
適用對象Author / 單一 reviewer 跑多輪Agent team / 自動化平行 review
失敗模式跳輪 → 某維度永遠做一半Instance 數量不足 → 維度覆蓋不全

兩軸正交、可疊加 — 同一 reviewer instance 內跑 multi-pass(#83)、跨 reviewer instance 各自獨立(本卡)。Case-first stage 3 設計同時用兩軸:3 個 reviewer instance 各自獨立 + 每個 reviewer 內部跑多輪 frame check。


為什麼這層設計重要

單一 reviewer 同時處理多維度有兩個限制:

  1. 維度盲點:一個 reviewer 同時看寫作規範 + 案例準確性 + 跨章一致性、容易維度互相干擾、最後每個維度都看不深
  2. Context 污染:reviewer 讀完整 commit + 所有案例 + 所有章節後、自身 context 被佔滿、給的建議也對應主 context 跟著沉重

Context 隔離解這兩個問題:

  • 用 N 個專責 reviewer、各自只處理一個維度 → 維度深度提升
  • Reviewer 各自 background、不污染主 context → 主 context 保留判讀空間
  • Reviewer 寫 output file、不傳 raw 內容到主 context → 主 context 增量極少

設計紀律:何時用幾個 reviewer

Reviewer 數量決定取決於審查對象的維度複雜度:

審查對象Reviewer 數維度分配
Case-driven 章節擴章3 個A 寫作規範 / B 案例引用準確性 / C 跨章一致性
方法論 / 自我審查4 個A 寫作規範 / B 三方自一致性 / C 概念邊界 / D compositional-writing 6 原則
一般 PR review1-2 個規範 + correctness、不需要 case fidelity 維度
高 stakes 內容(資安 / financial)4-5 個加 epistemic rigor reviewer(claim / evidence / threats)

維度設計要對審查對象客製、不要固定一套維度套所有任務。


平行 background 的具體實作

Case-first stage 3 的實作 pattern:

 1# Agent tool spawn 平行 background
 2for reviewer_id in ['A', 'B', 'C']:
 3    Agent({
 4        description: f"Reviewer {reviewer_id}: {dimension}",
 5        subagent_type: "general-purpose",
 6        run_in_background: True,
 7        prompt: get_reviewer_prompt(reviewer_id)
 8    })
 9
10# 主 context 不阻塞、繼續其他工作
11# Reviewer 完成時主 context 接通知(task-notification)
12# Reviewer 各自寫 output 到 /tmp/reviewer-{id}-report.md
13# 主 context 讀 output 彙整、不讀 raw conversation transcript

關鍵設計選擇:

  1. run_in_background: true:平行跑、不阻塞
  2. Reviewer 寫 output file:報告寫 /tmp/... 不污染主 conversation
  3. 主 context 不讀 reviewer transcript:只讀 task-notification 的 summary + 最後讀 output file
  4. Reviewer prompt 含「不要佔我主 context、報告寫進檔即可」明示:避免 reviewer 把 raw issue 都吐回主 conversation

Reviewer 維度設計:跟著任務客製化

Reviewer 維度不該固定 — backend/07 batch 1 案例驅動章節用「規範 / 案例 / 跨章一致」三維度、方法論審查用「規範 / 三方自一致 / 概念邊界 / compositional-writing」四維度。

設計原則:

  • 拆 axis 不重疊:每個 reviewer 的維度跟其他 reviewer 互斥(如「規範」vs「案例準確性」是不同 axis)
  • 覆蓋審查對象的關鍵風險:審查 case-driven 章節要 case fidelity reviewer、審查方法論要三方自一致性 reviewer
  • 預期 issue baseline 設好:每 reviewer 給 prompt 預期數量、reviewer 不要過度抓 / 漏抓
  • prompt 含主 context 保護指令:「報告寫到 /tmp/X-report.md、不要在主 conversation 吐 raw issue」

反模式

反模式後果
單一 reviewer 處理所有維度維度盲點 + context 污染、品質下降
Reviewer 不寫 output file、直接在 conversation 吐 raw issue主 context 被 issue 列表佔滿、修正循環沒空間
Reviewer 維度固定不變、套所有任務維度跟審查對象不對齊、漏抓關鍵風險
Reviewer 不平行、序列跑時間成本高、序列 30 分鐘 vs 平行 10 分鐘
Reviewer prompt 沒明示 baselineReviewer 抓 5 個或 50 個都「完成」、無法判讀品質
主 context 直接 Read reviewer transcript把 raw conversation 拉進主 context、context 污染

跟其他抽象層原則的關係

原則關係
#83 Writing multi-pass review互補 — #83 是 frame 軸(一個 reviewer N 輪)、本卡是 instance 軸(N 個 reviewer 各自獨立)、兩軸正交可疊加
#114 Multi-pass review 的 frame 顆粒度盲點解同類問題的不同手法 — #114 用「keyword bank / reader simulation / self-criticism」三機制擴大覆蓋、本卡用 instance 隔離擴大覆蓋
#67 寫作便利度跟意圖對齊反相關同骨 pattern — 單一 reviewer 處理多維度最便利(不用 spawn / coordinate)、但意圖(深度 review)失準
#42 兩次門檻跨機制 — 同 reviewer 多輪 catch 同類錯(#114)跟跨 reviewer instance(本卡)都是「換工具」的具體實作

判讀徵兆

訊號該做的事
Reviewer 給的建議「對應主 context 也沉重」Reviewer context 被污染、改 background instance 隔離
主 context 修正循環時、不知道從哪個 issue 開始Reviewer 報告沒精煉、補 reviewer prompt 要求 summary 開頭
多個 reviewer 抓到同類 issue維度設計重疊、調整 reviewer 維度分配
Reviewer 序列跑、單次 review 30 分鐘以上改平行 background、預期縮到 10 分鐘
主 context tokens 在 review 階段增長過快Reviewer 沒用 output file、改 prompt 明示「報告寫進檔」
想複用 reviewer prompt 到不同任務維度該重新設計、不是固定一套

核心:Agent team context 隔離是 LLM-era review 工具的設計模式 — 用 instance 隔離換維度深度跟 context 保護。維度設計要對任務客製化、不要固定不變。