Human-in-the-loop(HITL)
Human-in-the-loop(HITL)
Human-in-the-loop(HITL)的核心概念是「人類在 LLM 工作流中介入的設計」、用來在 fuzzy AI 行為的關鍵節點插入 deterministic 人類判斷。HITL 不是「有 vs 沒有」的二元、是 spectrum:位置由 risk(副作用範圍 + 失敗代價)跟自動 validator 能力決定。
概念位置
HITL 三種觸發時機:
| 時機 | 介入點 | 適合任務 |
|---|---|---|
| Pre-act | Action 執行前確認 | 不可逆 / 高代價(DB write、deploy) |
| Mid-stream | Agent 過程中遇不確定主動問 | 路徑分歧、需要 domain judgment |
| Post-hoc | 結果交付後 user 申訴 / 校正 | 評分類、低代價、user 數量大 |
跟其他相關概念對照:
| 概念 | 跟 HITL 的關係 |
|---|---|
| Agent 自主度分層 | Full auto / checkpoint / step-by-step / plan-first → 對應 HITL 時機 |
| Tool 副作用範圍 | 等級 1-2 不需 HITL、等級 4-5 強制 HITL |
| Guardrail | Schema / validator / monitoring 是自動 guardrail、HITL 是人類 guardrail |
設計責任
讀 AI 應用設計或 agent paper 看到「HITL」「human-in-the-loop」「approval flow」「appeal」就是這個機制。實作判讀:
- 位置由 risk 跟 validator 能力決定:risk 高 + validator 弱、HITL 頻率高;risk 低 + validator 強、HITL 頻率低。
- 三時機可組合:pre-act 擋高代價、mid-stream 處理 agent 不確定性、post-hoc 收回饋。三者各擋不同 risk class、不互斥。
- 避免橡皮圖章化的四條件:分級不同 risk 走不同 gate、approval UI 強制 show diff、reject 有明確 fallback、approval 訊號回饋進系統。任一不滿足、HITL 退化成形式。
- 跟 jagged frontier 的關係:frontier 外的任務該強制 HITL、不交給 user 自由心證。
- 跟 fuzzy engineering 典範的關係:HITL 是 fuzzy 行為的 deterministic guardrail 一種、不是預設要有、看 risk 跟自動 validator 能力決定。
完整 HITL 拓樸設計見 4.5 人機協作拓樸。