<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Aider on Tarragon</title><link>https://tarrragon.github.io/blog/tags/aider/</link><description>Recent content in Aider on Tarragon</description><generator>Hugo -- gohugo.io</generator><language>zh-TW</language><copyright>Tarragon (CC BY 4.0)</copyright><lastBuildDate>Mon, 11 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://tarrragon.github.io/blog/tags/aider/index.xml" rel="self" type="application/rss+xml"/><item><title>1.6 延伸方向：Web UI、coding agent、產圖</title><link>https://tarrragon.github.io/blog/llm/01-local-llm-services/extension-paths/</link><pubDate>Mon, 11 May 2026 00:00:00 +0000</pubDate><guid>https://tarrragon.github.io/blog/llm/01-local-llm-services/extension-paths/</guid><description>&lt;p>模組一前五章覆蓋了「Ollama + Continue.dev」這條最短路徑。日常路徑跑穩後，你可能會想往以下方向延伸：加裝 ChatGPT 風格的 Web UI、跑 coding agent、嘗試產圖。本章把這些延伸方向逐一列出、給優先順序、講清楚哪些是「換工具」、哪些是「換領域」。&lt;/p>
&lt;p>關鍵原則：&lt;strong>先把寫 code 跑穩、再考慮延伸&lt;/strong>。同時推進三條延伸通常會讓每條都停在半生不熟階段、累積成果有限。本章建議的順序是先 Web UI、再 coding agent、最後產圖；如果你只想嘗試一個、依自己最常用的場景挑。&lt;/p>
&lt;h2 id="本章目標">本章目標&lt;/h2>
&lt;p>讀完本章後，你應該能：&lt;/p>
&lt;ol>
&lt;li>列出三條延伸方向的代表工具與基本定位。&lt;/li>
&lt;li>知道每個方向跟寫 code 主路徑的關係。&lt;/li>
&lt;li>判斷自己現階段該不該往延伸方向走。&lt;/li>
&lt;li>對「產圖」這條歧路建立正確認知（不是換 model 就好）。&lt;/li>
&lt;/ol>
&lt;h2 id="延伸方向一chatgpt-風格-web-uiopen-webui">延伸方向一：ChatGPT 風格 Web UI（Open WebUI）&lt;/h2>
&lt;p>&lt;strong>定位&lt;/strong>：在瀏覽器跑一個類 ChatGPT 介面，連到本地 LLM 或雲端 LLM。屬於&lt;a href="https://tarrragon.github.io/blog/llm/00-foundations/three-layer-architecture/" data-link-title="0.2 介面 / 伺服器 / 模型三層架構" data-link-desc="把任何本地 LLM 工具放回正確的層級，用三層心智模型看懂工具關係">三層架構&lt;/a>的介面層，跟 Continue.dev 同層、解決不同情境（瀏覽器 vs IDE）。&lt;/p>
&lt;p>&lt;strong>典型使用情境&lt;/strong>：&lt;/p>
&lt;ol>
&lt;li>不在寫 code 但想跟 LLM 對話（解釋技術概念、寫文章草稿）。&lt;/li>
&lt;li>跟同事 / 家人分享 LLM 使用，他們不會用 VS Code。&lt;/li>
&lt;li>從手機 / iPad 連回家裡 Mac 跑的 Ollama。&lt;/li>
&lt;li>多輪深度對話、希望有歷史紀錄保存。&lt;/li>
&lt;/ol>
&lt;h3 id="主流選擇open-webui">主流選擇：Open WebUI&lt;/h3>
&lt;p>Open WebUI 是 open source 的 ChatGPT-clone，連 Ollama 與 OpenAI 相容 API。安裝最快路徑是 Docker：&lt;/p>





&lt;div class="highlight">&lt;pre tabindex="0" class="chroma">&lt;code class="language-bash" data-lang="bash">&lt;span class="line">&lt;span class="ln">1&lt;/span>&lt;span class="cl">docker run -d --name open-webui -p 3000:8080 &lt;span class="se">\
&lt;/span>&lt;/span>&lt;/span>&lt;span class="line">&lt;span class="ln">2&lt;/span>&lt;span class="cl">&lt;span class="se">&lt;/span> -e &lt;span class="nv">OLLAMA_BASE_URL&lt;/span>&lt;span class="o">=&lt;/span>http://host.docker.internal:11434 &lt;span class="se">\
&lt;/span>&lt;/span>&lt;/span>&lt;span class="line">&lt;span class="ln">3&lt;/span>&lt;span class="cl">&lt;span class="se">&lt;/span> -v open-webui:/app/backend/data &lt;span class="se">\
&lt;/span>&lt;/span>&lt;/span>&lt;span class="line">&lt;span class="ln">4&lt;/span>&lt;span class="cl">&lt;span class="se">&lt;/span> --restart always &lt;span class="se">\
&lt;/span>&lt;/span>&lt;/span>&lt;span class="line">&lt;span class="ln">5&lt;/span>&lt;span class="cl">&lt;span class="se">&lt;/span> ghcr.io/open-webui/open-webui:main&lt;/span>&lt;/span>&lt;/code>&lt;/pre>&lt;/div>&lt;p>&lt;code>host.docker.internal&lt;/code> 是 Docker Desktop 提供的 DNS 名稱、container 內透過它連到宿主機（macOS 本身）跑的 Ollama；Linux Docker 沒這個別名、要改用 &lt;code>--add-host=host.docker.internal:host-gateway&lt;/code> 或直接填宿主 IP。啟動後開 &lt;code>http://localhost:3000&lt;/code>、註冊本地帳號（資料只存本機 SQLite）、就有完整 ChatGPT 介面：&lt;/p>
&lt;ul>
&lt;li>對話歷史保存（本地 SQLite）&lt;/li>
&lt;li>多 model 切換、可同時對比兩個 model 回答&lt;/li>
&lt;li>系統 prompt 自訂、prompt template 管理&lt;/li>
&lt;li>上傳檔案分析（PDF、txt 等）&lt;/li>
&lt;li>圖片支援（如果本地 model 是多模態）&lt;/li>
&lt;/ul>
&lt;p>&lt;strong>陷阱&lt;/strong>：&lt;/p>
&lt;ol>
&lt;li>沒裝 Docker 的話要先學 Docker，是不小的前置學習。&lt;/li>
&lt;li>Open WebUI 預設不需要驗證，跑在 &lt;code>0.0.0.0&lt;/code> 會暴露在 LAN 上。要從外網用記得加 reverse proxy + auth。&lt;/li>
&lt;li>對話紀錄存在 Docker volume，刪 container 要小心保留 volume，否則歷史會消失。&lt;/li>
&lt;/ol>
&lt;p>&lt;strong>何時做這個延伸&lt;/strong>：日常 Continue.dev + Ollama 跑穩、用了至少一週、確認本地 LLM 對你有用，再加 Open WebUI 擴展使用情境。&lt;/p>
&lt;h2 id="延伸方向二coding-agentaidercline-等">延伸方向二：Coding Agent（aider、Cline 等）&lt;/h2>
&lt;p>&lt;strong>定位&lt;/strong>：比 Continue.dev 更主動的 LLM 寫 code 工具。Continue.dev 是「你提問、LLM 答」的對話模式；coding &lt;a href="https://tarrragon.github.io/blog/llm/knowledge-cards/agent/" data-link-title="LLM Agent" data-link-desc="把控制流交給 LLM 的應用模式：自主決策、跨多步呼叫工具、人類角色從主導變監督">agent&lt;/a> 是「你給目標、LLM 自己分多步驟改 code、跑測試、修錯誤」的代理模式。詳細的 agent loop 結構、失敗模式、人類審查協作見 &lt;a href="https://tarrragon.github.io/blog/llm/04-applications/agent-architecture/" data-link-title="4.4 Agent 架構原理" data-link-desc="Agent loop 結構、失敗模式、什麼任務適合 vs 不適合、跟人類審查的協作模型">4.4 Agent 架構原理&lt;/a>。&lt;/p></description><content:encoded><![CDATA[<p>模組一前五章覆蓋了「Ollama + Continue.dev」這條最短路徑。日常路徑跑穩後，你可能會想往以下方向延伸：加裝 ChatGPT 風格的 Web UI、跑 coding agent、嘗試產圖。本章把這些延伸方向逐一列出、給優先順序、講清楚哪些是「換工具」、哪些是「換領域」。</p>
<p>關鍵原則：<strong>先把寫 code 跑穩、再考慮延伸</strong>。同時推進三條延伸通常會讓每條都停在半生不熟階段、累積成果有限。本章建議的順序是先 Web UI、再 coding agent、最後產圖；如果你只想嘗試一個、依自己最常用的場景挑。</p>
<h2 id="本章目標">本章目標</h2>
<p>讀完本章後，你應該能：</p>
<ol>
<li>列出三條延伸方向的代表工具與基本定位。</li>
<li>知道每個方向跟寫 code 主路徑的關係。</li>
<li>判斷自己現階段該不該往延伸方向走。</li>
<li>對「產圖」這條歧路建立正確認知（不是換 model 就好）。</li>
</ol>
<h2 id="延伸方向一chatgpt-風格-web-uiopen-webui">延伸方向一：ChatGPT 風格 Web UI（Open WebUI）</h2>
<p><strong>定位</strong>：在瀏覽器跑一個類 ChatGPT 介面，連到本地 LLM 或雲端 LLM。屬於<a href="/blog/llm/00-foundations/three-layer-architecture/" data-link-title="0.2 介面 / 伺服器 / 模型三層架構" data-link-desc="把任何本地 LLM 工具放回正確的層級，用三層心智模型看懂工具關係">三層架構</a>的介面層，跟 Continue.dev 同層、解決不同情境（瀏覽器 vs IDE）。</p>
<p><strong>典型使用情境</strong>：</p>
<ol>
<li>不在寫 code 但想跟 LLM 對話（解釋技術概念、寫文章草稿）。</li>
<li>跟同事 / 家人分享 LLM 使用，他們不會用 VS Code。</li>
<li>從手機 / iPad 連回家裡 Mac 跑的 Ollama。</li>
<li>多輪深度對話、希望有歷史紀錄保存。</li>
</ol>
<h3 id="主流選擇open-webui">主流選擇：Open WebUI</h3>
<p>Open WebUI 是 open source 的 ChatGPT-clone，連 Ollama 與 OpenAI 相容 API。安裝最快路徑是 Docker：</p>





<div class="highlight"><pre tabindex="0" class="chroma"><code class="language-bash" data-lang="bash"><span class="line"><span class="ln">1</span><span class="cl">docker run -d --name open-webui -p 3000:8080 <span class="se">\
</span></span></span><span class="line"><span class="ln">2</span><span class="cl"><span class="se"></span>  -e <span class="nv">OLLAMA_BASE_URL</span><span class="o">=</span>http://host.docker.internal:11434 <span class="se">\
</span></span></span><span class="line"><span class="ln">3</span><span class="cl"><span class="se"></span>  -v open-webui:/app/backend/data <span class="se">\
</span></span></span><span class="line"><span class="ln">4</span><span class="cl"><span class="se"></span>  --restart always <span class="se">\
</span></span></span><span class="line"><span class="ln">5</span><span class="cl"><span class="se"></span>  ghcr.io/open-webui/open-webui:main</span></span></code></pre></div><p><code>host.docker.internal</code> 是 Docker Desktop 提供的 DNS 名稱、container 內透過它連到宿主機（macOS 本身）跑的 Ollama；Linux Docker 沒這個別名、要改用 <code>--add-host=host.docker.internal:host-gateway</code> 或直接填宿主 IP。啟動後開 <code>http://localhost:3000</code>、註冊本地帳號（資料只存本機 SQLite）、就有完整 ChatGPT 介面：</p>
<ul>
<li>對話歷史保存（本地 SQLite）</li>
<li>多 model 切換、可同時對比兩個 model 回答</li>
<li>系統 prompt 自訂、prompt template 管理</li>
<li>上傳檔案分析（PDF、txt 等）</li>
<li>圖片支援（如果本地 model 是多模態）</li>
</ul>
<p><strong>陷阱</strong>：</p>
<ol>
<li>沒裝 Docker 的話要先學 Docker，是不小的前置學習。</li>
<li>Open WebUI 預設不需要驗證，跑在 <code>0.0.0.0</code> 會暴露在 LAN 上。要從外網用記得加 reverse proxy + auth。</li>
<li>對話紀錄存在 Docker volume，刪 container 要小心保留 volume，否則歷史會消失。</li>
</ol>
<p><strong>何時做這個延伸</strong>：日常 Continue.dev + Ollama 跑穩、用了至少一週、確認本地 LLM 對你有用，再加 Open WebUI 擴展使用情境。</p>
<h2 id="延伸方向二coding-agentaidercline-等">延伸方向二：Coding Agent（aider、Cline 等）</h2>
<p><strong>定位</strong>：比 Continue.dev 更主動的 LLM 寫 code 工具。Continue.dev 是「你提問、LLM 答」的對話模式；coding <a href="/blog/llm/knowledge-cards/agent/" data-link-title="LLM Agent" data-link-desc="把控制流交給 LLM 的應用模式：自主決策、跨多步呼叫工具、人類角色從主導變監督">agent</a> 是「你給目標、LLM 自己分多步驟改 code、跑測試、修錯誤」的代理模式。詳細的 agent loop 結構、失敗模式、人類審查協作見 <a href="/blog/llm/04-applications/agent-architecture/" data-link-title="4.4 Agent 架構原理" data-link-desc="Agent loop 結構、失敗模式、什麼任務適合 vs 不適合、跟人類審查的協作模型">4.4 Agent 架構原理</a>。</p>
<p><strong>主流選擇</strong>：</p>
<table>
  <thead>
      <tr>
          <th>工具</th>
          <th>介面</th>
          <th>定位</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td>aider</td>
          <td>CLI</td>
          <td>git-aware、把 LLM 改的 diff 直接 commit、支援 multi-file edit</td>
      </tr>
      <tr>
          <td>Cline</td>
          <td>VS Code 擴充</td>
          <td>在 VS Code 內跑 agent、可執行 shell command</td>
      </tr>
      <tr>
          <td>Cursor Agent</td>
          <td>Cursor 內建</td>
          <td>Cursor 訂閱戶可用、雲端綁定</td>
      </tr>
  </tbody>
</table>
<p>選擇三個工具的延伸判讀：</p>
<ul>
<li><strong>aider</strong>：當主要工作流是「在 terminal + git 內完成」、想讓 LLM 把 diff 直接 commit 進 history、aider 的 CLI-first + git-aware 設計最對位。失敗模式：跨多檔修改超過 5 個檔時、aider 的 prompt 規劃容易斷裂；改回 Continue.dev 手動逐檔修可能更穩。</li>
<li><strong>Cline</strong>：當你已在 VS Code 內工作、想要 agent 能跑 shell command（執行測試、跑 build 看錯誤）並 loop 修錯時、Cline 比 aider 更貼近「IDE 內 agent」。失敗模式：本地模型在「規劃 → 執行 shell → 解讀錯誤 → 改 code」這個 loop 上接受度不穩、常需要人工接管。</li>
<li><strong>Cursor Agent</strong>：當你已是 Cursor 訂閱戶、agent 預設綁雲端旗艦（成功率最高、但 prompt / code 會送到 Cursor 雲端）。NDA / 合規場景不適用、本地 LLM 接入也是次要 surface。</li>
</ul>
<p><strong>為什麼是 advanced</strong>：coding agent 需要本地模型能「跟著規劃跑多步驟、用 tools、不偏離目標」。這部分是本地 LLM 的弱項（見 <a href="/blog/llm/01-local-llm-services/expectation-management/" data-link-title="1.5 期望管理：本地 LLM 的擅長領域與分工" data-link-desc="本地 LLM 是免費的初階 pair programmer：辨識它的擅長領域、跟雲端旗艦做結構性分工">1.5 期望管理</a>）；現階段本地模型跑 coding agent 的成功率明顯低於雲端旗艦。</p>
<p><strong>用 aider 跑本地 LLM 的最小範例</strong>：</p>





<div class="highlight"><pre tabindex="0" class="chroma"><code class="language-bash" data-lang="bash"><span class="line"><span class="ln">1</span><span class="cl"><span class="c1"># 裝 aider</span>
</span></span><span class="line"><span class="ln">2</span><span class="cl">pip install aider-chat
</span></span><span class="line"><span class="ln">3</span><span class="cl">
</span></span><span class="line"><span class="ln">4</span><span class="cl"><span class="c1"># 在 git repo 內啟動，用本地 Ollama</span>
</span></span><span class="line"><span class="ln">5</span><span class="cl">aider --model ollama/gemma4:31b-coding-mtp-bf16 <span class="se">\
</span></span></span><span class="line"><span class="ln">6</span><span class="cl"><span class="se"></span>  --ollama-base-url http://localhost:11434</span></span></code></pre></div><p>aider 會把當前 repo 的相關檔案打進 prompt、把 LLM 生成的 diff apply 到本機、自動 commit。簡單任務（單檔重構、加 test）成功率還行；複雜任務（跨檔案、需要規劃）失敗率高。</p>
<p><strong>陷阱</strong>：</p>
<ol>
<li>本地 LLM 跑 aider 比跑 Continue.dev 慢得多、因為每輪 agent loop 都要重新處理長 context。</li>
<li>coding agent 對 long context 敏感、本地 <a href="/blog/llm/knowledge-cards/ttft/" data-link-title="TTFT" data-link-desc="Time To First Token：送出 prompt 到第一個 token 出現的等待時間">TTFT</a> 痛點被放大。Agent loop 每輪都會 mutate prompt（前一輪結果加入下一輪的 context）、<a href="/blog/llm/knowledge-cards/kv-cache/" data-link-title="KV Cache" data-link-desc="已處理 token 的 attention 中間結果暫存：避免重算、加速後續生成">KV cache</a> 命中率低、每輪都要重新做完整 prefill。</li>
<li>失敗時 agent 可能 commit 不可用的 code、要記得 <code>git diff</code> 審過再 push。</li>
</ol>
<p><strong>何時做這個延伸</strong>：本地模型在 Continue.dev 對話模式下表現穩定、且你想看看「multi-step 自動化」能幫到什麼程度。對多數讀者、這條延伸在 2026 年 5 月時是「值得試一週、但不一定留下」。</p>
<p><strong>何時該停</strong>：以下訊號出現時、agent 路線在你的工作流暫時不成立、回到 Continue.dev 對話模式：</p>
<ul>
<li>連續 5 個 multi-step 任務都需要人工接管 / 中途介入修錯</li>
<li>TTFT 持續 &gt; 30 秒、agent loop 的「等待 → 接管」節奏比手寫快不了多少</li>
<li>agent commit 進 git history 的 diff 通過率 &lt; 50%、審查與 revert 的成本超過自己寫</li>
<li>簡單任務（單檔重構、加 test）本地 agent 也常失敗、表示模型 capacity 對 agent 規劃不足</li>
</ul>
<h2 id="延伸方向三產圖stable-diffusionflux-等">延伸方向三：產圖（Stable Diffusion、Flux 等）</h2>
<p>產圖是另一個專業領域、工具鏈跟概念體系另起一套、跟 LLM 寫 code 沒有共用的伺服器層或 model layer。產圖用的是 <strong>Diffusion 架構</strong>、跟寫 code 用的 <strong>Transformer 架構</strong>是兩個獨立的神經網路類型。</p>
<p>四個維度上產圖跟寫 code 的工作流互不相通：</p>
<ol>
<li><strong>工具鏈各自獨立</strong>：Ollama 服務 <a href="/blog/llm/knowledge-cards/transformer/" data-link-title="Transformer" data-link-desc="寫 code 用的 LLM 神經網路架構：基於 attention 機制、自回歸生成 token">Transformer</a> LLM、Draw Things / ComfyUI 服務 <a href="/blog/llm/knowledge-cards/diffusion/" data-link-title="Diffusion" data-link-desc="產圖用的生成式 AI 架構：跟寫 code 用的 Transformer 是不同路線">Diffusion</a> 模型、兩條路線的伺服器與生態互不通用。</li>
<li><strong>prompt 風格不同</strong>：寫 code 是 instruction 形式、產圖是 descriptive prompt + negative prompt + sampler 參數。</li>
<li><strong>學習成本各自獨立</strong>：產圖有自己的 LoRA、ControlNet、IP-Adapter、refiner 等概念體系、學起來等於進入新領域。</li>
<li><strong>硬體最適規格不同</strong>：寫 code 看記憶體預算（<a href="/blog/llm/knowledge-cards/unified-memory/" data-link-title="Unified Memory Architecture" data-link-desc="Apple Silicon 讓 CPU / GPU / NE 共用同一塊記憶體：跑大模型的優勢來源">跑大模型</a>）、產圖看 GPU 算力與 VRAM 頻寬。</li>
</ol>
<p>本章只給入口資訊、不展開教學。</p>
<p><strong>主流工具</strong>：</p>
<table>
  <thead>
      <tr>
          <th>工具</th>
          <th>定位</th>
          <th>適合誰</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td>Draw Things</td>
          <td>Mac 原生 app，GUI 友善，免費</td>
          <td>macOS 使用者入門首選</td>
      </tr>
      <tr>
          <td>ComfyUI</td>
          <td>節點式工作流，跨平台，需要 Python 環境</td>
          <td>想客製化流程、進階使用者</td>
      </tr>
      <tr>
          <td>AUTOMATIC1111</td>
          <td>Web UI，跨平台，需要 Python</td>
          <td>Linux / NVIDIA 玩家為主</td>
      </tr>
      <tr>
          <td>Diffusers</td>
          <td>Hugging Face 的 Python library</td>
          <td>開發者、要嵌入產品</td>
      </tr>
  </tbody>
</table>
<p><strong>主流模型</strong>：</p>
<table>
  <thead>
      <tr>
          <th>模型</th>
          <th>風格特色</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td>Stable Diffusion 3.5</td>
          <td>通用、社群成熟、生態最大</td>
      </tr>
      <tr>
          <td>Flux</td>
          <td>質感高、prompt 跟隨度高</td>
      </tr>
      <tr>
          <td>SDXL</td>
          <td>SD 1.5 的進階版，仍有大量 LoRA</td>
      </tr>
  </tbody>
</table>
<p><strong>Apple Silicon Mac 跑產圖的現實</strong>：</p>
<ol>
<li>24GB+ Mac 可以順暢跑 SDXL / Flux。記憶體需求其實比 LLM 低（一張圖 ~ 8GB），但對 GPU 算力敏感。</li>
<li>M4 Max 跑 Flux 生 1024x1024 圖約 15 ~ 30 秒一張，可接受。</li>
<li>Draw Things 在 Mac App Store 可下載，是最簡單的入門路徑。</li>
</ol>
<p><strong>本指南的立場</strong>：先把寫 code 跑穩、再考慮產圖。產圖屬於獨立的學習主題、另外找專門教材會學得更有效率。</p>
<h2 id="給讀者的延伸順序">給讀者的延伸順序</h2>
<p>如果你想嘗試延伸方向，建議的順序：</p>
<ol>
<li><strong>先用一個月本地 LLM 寫 code</strong>。確認 Ollama + Continue.dev 對你有用、習慣了切換。</li>
<li><strong>第一個延伸：Open WebUI</strong>。加裝最低成本（只多裝 Docker），擴展使用情境到非 VS Code 場景。</li>
<li><strong>第二個延伸：aider 或 Cline</strong>。試 coding agent，評估本地模型能 handle 多複雜的多步驟任務。</li>
<li><strong>第三個延伸：產圖</strong>。完全獨立的學習投入，跟前面工具鏈無關。</li>
</ol>
<p>依序進階。先讓基底穩、再疊加延伸、學習曲線最平滑。</p>
<h2 id="不在本章範圍內的延伸">不在本章範圍內的延伸</h2>
<p>下列延伸方向值得知道存在，但不在本指南內展開：</p>
<table>
  <thead>
      <tr>
          <th>方向</th>
          <th>為什麼不展開</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td><a href="/blog/llm/knowledge-cards/rag/" data-link-title="RAG" data-link-desc="Retrieval-Augmented Generation：動態外掛知識給 LLM、繞開模型參數記憶的靜態限制">RAG</a>（檢索增強生成）</td>
          <td>需要 vector database、文件 chunking、embedding 設計、見 <a href="/blog/llm/04-applications/rag-principles/" data-link-title="4.1 RAG 原理：retrieval &#43; augmentation 模式" data-link-desc="為什麼模型需要外掛知識、語意相似 vs 字面相似、chunking 的本質取捨、retrieval 失敗的根本原因">4.1 RAG 原理</a></td>
      </tr>
      <tr>
          <td>Fine-tuning</td>
          <td>訓練流程跟跑現成模型是不同工程；資源、資料、評估都複雜</td>
      </tr>
      <tr>
          <td>Multi-modal（語音、影片）</td>
          <td>工具鏈跟生態完全獨立</td>
      </tr>
      <tr>
          <td><a href="/blog/llm/knowledge-cards/mcp/" data-link-title="MCP（Model Context Protocol）" data-link-desc="LLM application ↔ 外部 tool server 之間的標準化協議、複用 OpenAI 相容 API 的成功模式">MCP</a>（Model Context Protocol）伺服器整合</td>
          <td>是工具串接協定、見 <a href="/blog/llm/04-applications/application-protocols/" data-link-title="4.6 應用層協議：function calling / structured output / MCP" data-link-desc="三個常被混為一談的概念：模型能力、sampling 約束、server 協議，三者的層級差異與組合方式">4.6 應用層協議</a></td>
      </tr>
      <tr>
          <td>部署到雲端 GPU / Linux server</td>
          <td>本指南範圍只在 Apple Silicon Mac</td>
      </tr>
  </tbody>
</table>
<p>需要這些方向時請另尋專門資源；硬塞進來會稀釋本指南「Mac 本地寫 code」這條最短路徑。</p>
<h2 id="下一步">下一步</h2>
<p>實作範例（含 ComfyUI / Whisper / Piper TTS / RAG / MCP）見 <a href="/blog/llm/01-local-llm-services/hands-on/" data-link-title="Hands-on：本地 AI 工具實作筆記" data-link-desc="Ollama / ComfyUI / Whisper / Piper TTS：實際安裝、驗證、跑通的紀錄。隨工具版本演化、跟 1.x 原理章節互補。">Hands-on 章節</a>。</p>
<p>讀到這裡、本指南的核心內容就完了。下一步是回到 <a href="/blog/llm/00-foundations/" data-link-title="模組零：基礎知識與心智模型" data-link-desc="建立本地 LLM 的心智模型、釐清 MLX / MTP / oMLX 等常被混淆的術語、Apple Silicon 記憶體現實">模組零</a> 或 <a href="/blog/llm/01-local-llm-services/" data-link-title="模組一：本地 LLM 服務的安裝與應用" data-link-desc="Ollama、LM Studio、llama.cpp 的安裝與差異、VS Code &#43; Continue.dev 整合、模型選型與期望管理">模組一</a> 任一章節做深度閱讀、或實際打開終端機跑第一個 <code>ollama run</code>、把概念變成肌肉記憶。</p>
]]></content:encoded></item></channel></rss>