LLM Agent

2026-05-11

LLM Agent 的核心概念是「把控制流的所有權從人類交給 LLM」。傳統對話 LLM 是「人類問、模型答」、每輪 turn 獨立；agent 是「LLM 自己決定下一步、自己呼叫工具、自己評估結果」、跨多步累積 context。

概念位置

Agent 是應用層的工作流模式、建立在 tool use、function calling、structured output、autoregressive 生成之上。Agent loop 五步骨架（感知 → 推理 → 行動 → 觀察 → 判斷終止）是所有 agent framework 的共通結構、不論具體實作。本地 LLM 受 tool use 訓練不足、長 context prefill 痛點（見 TTFT、prefill）、規劃能力弱等限制、跑 agent 現階段失敗率高於雲端旗艦。

可觀察訊號與例子

寫 code 場景的代表 agent：aider、Cline、Cursor Agent。判讀 agent 失敗訊號分三類：context drift（累積偏離原目標）、目標漂移（子目標完成就停、原任務沒完成）、tool 結果誤判（tool 回 error 模型 hallucinate「成功」繼續推）。

設計責任

決定該用 agent 還是 single-call、看任務是否有明確子步驟 + 客觀驗證訊號（test 通過、file 寫入）。模糊探索性任務不適合 agent。Agent 跑高風險任務時、人類審查粒度應該配合工具的副作用範圍——可逆任務全自動、不可逆任務 step-by-step approval。詳細展開見 4.4 Agent 架構原理。

#llm #knowledge-cards