Reflection(self-critique)的核心概念是「模型先生成一個草版、再對自己的草版 critique、再修改」。屬於推理引導類的 prompting 技術、也是 workflow pattern 的基本模式之一。跟 chain-of-thought 不同:CoT 是「過程要 explicit」、reflection 是「先寫一版再批評再改」、有明確的兩階段。

概念位置

Reflection 三步:

1[Generate]    模型生成 v1
23[Critique]    模型(或 critic LLM)對 v1 給回饋
45[Refine]      模型按回饋生成 v2
67(可選 loop)

跟其他模式對照:

模式結構主要解的問題
CoTThink step by step、單次生成隱式推理變 explicit
ReflectionGenerate → critique → refine一次生成不夠好、需要二次審視
Multi-stepRetrieve / decide / retrieve again資訊不足、要動態補資料

設計責任

讀 prompt engineering / agent paper 看到「reflection」「self-critique」「self-refine」「critic」就是這個機制。實作判讀:

  1. 適用模型有能力辨識「自己寫的不夠好」、critique 跟 generator 不會共用同樣 blind spot。
  2. 失敗在 systematic error:critique 跟 generator 是同個模型、訓練分佈中的盲點不會因為「再想一次」消失。判讀訊號:critique 每次給很像的建議、或修完還是同一類錯——換 critic 用不同 base model、或加外部驗證(test、lint、schema)取代 LLM critique。
  3. 失敗在低能力模型:critic 能力不足、產不出有用建議、徒增 cost / latency。
  4. 失敗在無限循環:沒有客觀停止訊號、reflection 一直跑、cost 爆掉。緩解:step cap + 外部 metric(test pass、schema valid)。
  5. 失敗在過度修正:每次 reflection 都改一點、累積結果變糟(過度 fitting critic 意見)。緩解:保留 baseline、reflection 結果要跟 baseline 比、不一定採用。

Agent loop 是 reflection 的延伸特例、進階失敗模式見 4.4 Agent 架構。完整 workflow pattern 比較見 4.7 Workflow patterns