Human-in-the-loop(HITL)的核心概念是「人類在 LLM 工作流中介入的設計」、用來在 fuzzy AI 行為的關鍵節點插入 deterministic 人類判斷。HITL 不是「有 vs 沒有」的二元、是 spectrum:位置由 risk(副作用範圍 + 失敗代價)跟自動 validator 能力決定。

概念位置

HITL 三種觸發時機:

時機介入點適合任務
Pre-actAction 執行前確認不可逆 / 高代價(DB write、deploy)
Mid-streamAgent 過程中遇不確定主動問路徑分歧、需要 domain judgment
Post-hoc結果交付後 user 申訴 / 校正評分類、低代價、user 數量大

跟其他相關概念對照:

概念跟 HITL 的關係
Agent 自主度分層Full auto / checkpoint / step-by-step / plan-first → 對應 HITL 時機
Tool 副作用範圍等級 1-2 不需 HITL、等級 4-5 強制 HITL
GuardrailSchema / validator / monitoring 是自動 guardrail、HITL 是人類 guardrail

設計責任

讀 AI 應用設計或 agent paper 看到「HITL」「human-in-the-loop」「approval flow」「appeal」就是這個機制。實作判讀:

  1. 位置由 risk 跟 validator 能力決定:risk 高 + validator 弱、HITL 頻率高;risk 低 + validator 強、HITL 頻率低。
  2. 三時機可組合:pre-act 擋高代價、mid-stream 處理 agent 不確定性、post-hoc 收回饋。三者各擋不同 risk class、不互斥。
  3. 避免橡皮圖章化的四條件:分級不同 risk 走不同 gate、approval UI 強制 show diff、reject 有明確 fallback、approval 訊號回饋進系統。任一不滿足、HITL 退化成形式。
  4. jagged frontier 的關係:frontier 外的任務該強制 HITL、不交給 user 自由心證。
  5. 跟 fuzzy engineering 典範的關係:HITL 是 fuzzy 行為的 deterministic guardrail 一種、不是預設要有、看 risk 跟自動 validator 能力決定。

完整 HITL 拓樸設計見 4.5 人機協作拓樸