本文件提供 WRAP 每個階段的詳細操作技巧、範例和判斷規則。


0. 錨點確認 — 詳細操作

任務認領時的錨點確認

每個任務認領後、分析/派發前,確認核心目的:

問題對選項 A選項 B
交付策略快速交付(最小修改)穩定架構(花時間做對)
問題性質找 Bug(根因 + 最小修復)系統設計改善(系統性重構)
優先維度使用者 UX 體驗執行效能

這是權重排序問題:在這個任務的脈絡下,哪個權重更高?

開發途中的重新確認

觸發重新確認的時機:

  • 資源耗盡時 → 「簡化 scope 快速交付,還是維持完整度?」
  • 發現額外問題時 → 「一起處理還是建任務延後?」
  • 方案需大幅修改時 → 「核心目的有沒有改變?」

W — 擴增選項詳細技巧

爬梯子法範例

以「掛鉤(Hook)錯誤處理」類的除錯場景為例:

層級搜尋結果
0. 身邊當前專案既有模組(例如追蹤器/派發器)已有 API 但沒接線
1. 同層同類元件的清理機制類似功能的掛鉤(Hook)已有方案
2. 同領域官方 GitHub Issues多個 Issues 報告同樣症狀
3. 跨領域其他 extension host 錯誤處理類比:宿主不應被擴充崩潰

教訓:在「身邊」層打轉多輪,不如首輪就爬到「同領域」層 — 往往 10 分鐘解決。

向外求解(Find Someone Who’s Solved Your Problem)

核心問句:「還有誰跟我一樣在為這個問題傷腦筋?我可以從他們那裡學到什麼?」

做法:

  1. GitHub Issues 搜尋:{工具名} {症狀關鍵字}
  2. Stack Overflow / 官方文件搜尋
  3. 如果找到 → 可能根本不需要自己實作

AI 內建知識調用

AI 擁有兩種「爬梯子」工具:

工具適用場景範例
內建知識經典解法、設計模式「CLI 掛鉤(Hook)系統的常見錯誤處理模式?」
網路搜尋(WebSearch)最新進展、特定版本「Claude Code hooks 2026 hook error」

擴增選項三步走:

  1. 自問內建知識 → 產出 3-5 個已知方案
  2. 網路搜尋(WebSearch)驗證 → 確認是否過時、發現新解法
  3. 當前專案適配 → 選擇適合當前架構的方案

假選項偵測規則(季辛吉陷阱)

季辛吉回憶錄:國務院給尼克森三選項(核戰/現狀/投降),實際只有「現狀」可選。

檢查問題不通過信號
根因多元性選項基於不同根因假設?全指向同一根因
途徑多元性選項代表不同解決途徑?全是同一途徑的參數微調
利害關係人只考慮一方觀點?沒有「不做」或「問別人」的選項
框架測試能一句話概括所有選項?可以 → 框架太窄

範例案例:改 exit code / 改 stderr / 改 stdout → 本質都是「修改掛鉤(Hook)」→ 假選項。


R — 現實檢驗詳細技巧

問對問題:基本率問法

向 AI 問基本率(過去和現在),不問預測(未來):

  • 「類似案子的重要變數是什麼?」
  • 「多少比率在 X 階段就解決?」
  • 「成功的案例有什麼共同特徵?」

AI 本質上是基本率的巨大資料庫 — 擅長回答「通常怎麼解決」而非「這次會不會成功」。

大範圍觀照(Zoom Out)+ 近距離檢視(Zoom In)操作

大範圍觀照(Zoom Out)

  • 搜尋社群基本率:「多少人遇到同樣問題?」
  • AI 內建知識:「這類問題通常怎麼解決?」
  • 統計性判斷:「做了這決定,合理預期會發生什麼?」

近距離檢視(Zoom In)

  • 讀具體案例內文(不只 Issue 標題)
  • 讀 source code(不只代理人報告,實際 git diff)
  • 小規模實驗驗證假設

如同羅斯福的訊息策略:不完全依賴單一來源,多源交叉驗證。

試水溫操作範例

場景全力投入(錯誤)試水溫(正確)
hook error直接改核心函式先手動測試一個 hook 的 exit code
語意重命名一次派發改 5 個檔案先改 1 個檔案確認消費端不壞
新功能設計完整實作後才測試先寫最小概念驗證(POC)驗證核心假設

試水溫成本:5 分鐘。全力投入失敗成本:2 次修改 + 1 次回退 + 問題惡化。

最強版本論證流程

來源:努金調解索尼 vs 蘋果 — 「我會陳述對方的立場,且優於其自我陳述。」

操作步驟:

  1. 列出被放棄選項的優點(比其支持者說的更完整)
  2. 列出選定方案的缺點(至少 3 個)
  3. 自問:「我能否闡明反對意見,且優於反對者自己的陳述?」
    • 能 → 真的理解了取捨(trade-off)
    • 說明不足 → 可能還在確認偏誤中 → 回到 R 階段

A — 拉開距離詳細技巧

機會成本顯性化範例

除錯情境範例:

1選項 A:修改核心錯誤處理函式
2  機會成本:花 2 小時可能白做,這段時間可以推進其他任務
3  風險:根因判斷錯誤 → 改壞更多元件
4  不選其他的代價:沒有搜尋社群,可能 10 分鐘就有答案
5
6選項 B:搜尋 GitHub Issues
7  機會成本:10 分鐘
8  風險:找不到相關 Issue
9  不選其他的代價:如果是自己的 bug 就需要回來修

工具選擇檢查(Tool selection check)詳細技巧

問題背景:LLM 在選工具(tool)時常見一種傾向:單步決策敏感、總步驟數盲點。容易把「3 步繞路」誤估為「1 步直達」,因為每個單步看起來都合理。物化工具(tool)名稱(「用 Write」)會進一步窄化思考框架。

觸發條件

  • 選工具(tool)前(選擇具體工具呼叫的那個瞬間)
  • 預估步驟數 > 2(有 2 個以上 tool call 才完成目的)
  • 涉及 Write/Bash 組合(尤其 Write 到中介檔再讀回再寫入的模式)

4 問操作流程

問題自我質疑回答「是」的行動
Q1 物化檢查我描述任務時用的是工具(tool)名稱(「用 Write 建 ctx 檔」),還是目的語言(「把 context 寫進任務紀錄欄位」)?重寫任務描述為目的語言,再重選工具(tool)
Q2 步驟數檢查列出實際 tool call 序列,數一下是幾步? 有無「1 步路徑」(單一 tool call 直接完成)被忽略?換成 1 步路徑(heredoc / Edit 直接改 md)
Q3 目的地檢查產出的最終目的地是哪裡?(CLI stdout / 檔案系統 / 任務紀錄 / log)工具選擇是否匹配目的地?目的地若是任務紀錄 → 首選 Edit;若是 append CLI → 首選 heredoc Bash
Q4 白名單檢查我選的 tool 是否在「低摩擦首選」名單外? 有無不必要引入中介檔?換成白名單內工具

「低摩擦首選」白名單(長文寫入類):

目的地首選工具(tool)次選避免
寫入任務紀錄欄位Edit(直接編輯紀錄)task append + heredocWrite 暫存檔 → Read → Bash
執行 CLI 含長參數heredoc $(cat <<'EOF'...EOF)單引號整段Write → Bash 讀入
寫 commit messageheredoc多行 -mWrite 中介檔

情境反向驗證

原場景(繞路):決策者要把 1.5KB context 寫入任務紀錄的 Solution 欄位,選擇:

  1. Write /tmp/ctx.md 建暫存檔
  2. Read /tmp/ctx.md 讀回
  3. Bash: task append --file /tmp/ctx.md

4 問驗證

問題原場景答案結論
Q1 物化「用 Write 建 ctx 檔」(物化) vs「把 context 寫進任務紀錄」(目的)觸發 → 重寫為目的語言
Q2 步驟數3 步(Write / Read / Bash) vs 1 步(heredoc Bash 或 Edit 任務紀錄)觸發 → 有 1 步路徑被忽略
Q3 目的地目的地是任務紀錄的 Solution 欄位;/tmp 中介檔非必要觸發 → 應首選 Edit
Q4 白名單Write 到 /tmp 屬白名單外繞路觸發 → 換 heredoc 或 Edit

正確路徑(1 步直達)

1task append TASK-ID --section "Solution" "$(cat <<'EOF'
2(content here)
3EOF
4)"

或更直接:Edit 工具打開任務紀錄編輯 Solution 欄位(0 步 tool call,整合在 Edit 單次呼叫內)。

教訓:4 問任一觸發,都是「繞路訊號」——單步都合理不代表總路徑短。

核心優先事項排序

典型軟體專案的優先事項(由高到低)僅供參考,各專案應建立自己的排序:

  1. 產品功能開發
  2. 程式碼品質
  3. 開發流程改善
  4. 工具維護

衝突時用排序終結爭論:第 4 項 vs 第 1 項 → 第 1 項勝 → 工具維護建任務延後。


P — 準備好犯錯詳細技巧

行前預想操作

Gary Klein 方法:先假設計畫失敗了,然後問「是什麼殺了它?」

  • 比問「可能會失敗嗎?」多產出 25% 的洞察(且更具體)

除錯情境的行前預想範例(如果當時做了):

  • 失敗原因 1:根因判斷錯誤(可能性 > 50%)→ 已超過閾值,不應執行
  • 失敗原因 2:影響範圍不清(可能性 40%)
  • 失敗原因 3:實際執行環境行為不如預期(可能性 60%)

安全係數參考

領域安全倍數
電梯鋼纜x11
太空梭地面設施x4
微軟軟體專案+30% 時間
代理人任務派發預估時間 x 1.3-1.5(經驗起點、依任務調整;非實證數字)

展現謙卑:我們容易過度自信,所以預留緩衝。前三列為外部來源,最後一列是本框架的經驗起點、與 SKILL.md P 階段一致。


Last Updated: 2026-04-18 Version: 1.2.0 — A 階段新增工具選擇檢查(Tool selection check)4 問 + 情境反向驗證