<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Model-Behavior on Tarragon</title><link>https://tarrragon.github.io/blog/tags/model-behavior/</link><description>Recent content in Model-Behavior on Tarragon</description><generator>Hugo -- gohugo.io</generator><language>zh-TW</language><copyright>Tarragon (CC BY 4.0)</copyright><lastBuildDate>Tue, 12 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://tarrragon.github.io/blog/tags/model-behavior/index.xml" rel="self" type="application/rss+xml"/><item><title>Hallucination</title><link>https://tarrragon.github.io/blog/llm/knowledge-cards/hallucination/</link><pubDate>Tue, 12 May 2026 00:00:00 +0000</pubDate><guid>https://tarrragon.github.io/blog/llm/knowledge-cards/hallucination/</guid><description>&lt;p>Hallucination 的核心概念是「LLM 生成的內容語法、語氣、結構看起來合理、但內容上是事實錯誤、引用不存在的來源、虛構不存在的 entity」。這是 LLM 基於統計分布生成的固有特性；以目前的研究跟工程實踐、靠「更大模型」或「更好對齊」很難徹底消除、可控的做法是用工程手段降低觸發率跟下游偵測。&lt;/p>
&lt;h2 id="概念位置">概念位置&lt;/h2>
&lt;p>Hallucination 的常見形態：&lt;/p>
&lt;table>
 &lt;thead>
 &lt;tr>
 &lt;th>形態&lt;/th>
 &lt;th>例子&lt;/th>
 &lt;th>風險&lt;/th>
 &lt;/tr>
 &lt;/thead>
 &lt;tbody>
 &lt;tr>
 &lt;td>虛構引用&lt;/td>
 &lt;td>引用不存在的論文 / API / 函式名稱&lt;/td>
 &lt;td>使用者照抄、出錯&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>虛構 entity&lt;/td>
 &lt;td>虛構不存在的公司 / 人名 / 地址&lt;/td>
 &lt;td>寫入文件、產生誤導&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>數值幻覺&lt;/td>
 &lt;td>給看似精確但實際錯誤的數字&lt;/td>
 &lt;td>商業 / 工程決策被誤導&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>因果幻覺&lt;/td>
 &lt;td>編造看似合理但不存在的因果關係&lt;/td>
 &lt;td>推理鏈不可信&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>法律 / 醫療幻覺&lt;/td>
 &lt;td>虛構不存在的法條 / 治療方案&lt;/td>
 &lt;td>高風險領域、可能造成實際傷害&lt;/td>
 &lt;/tr>
 &lt;/tbody>
&lt;/table>
&lt;p>降低 / 偵測 hallucination 的常見手段（依場景變化）：&lt;/p>
&lt;ol>
&lt;li>&lt;strong>&lt;a href="https://tarrragon.github.io/blog/llm/knowledge-cards/rag/" data-link-title="RAG" data-link-desc="Retrieval-Augmented Generation：動態外掛知識給 LLM、繞開模型參數記憶的靜態限制">RAG&lt;/a>&lt;/strong>：把真實內容檢索後注入 prompt、模型基於真實內容生成。&lt;/li>
&lt;li>&lt;strong>temperature 降低&lt;/strong>：採樣較保守、減少創造性但也減少幻覺。&lt;/li>
&lt;li>&lt;strong>citation 要求&lt;/strong>：prompt 要求列出引用、後續可驗證。&lt;/li>
&lt;li>&lt;strong>下游驗證&lt;/strong>：對輸出做事實檢查（如 code 跑 compiler、引用查實際資料庫）。&lt;/li>
&lt;li>&lt;strong>明確的「不知道就說不知道」instruction&lt;/strong>：降低過度自信、但不能消除。&lt;/li>
&lt;/ol>
&lt;blockquote>
&lt;p>&lt;strong>事實查核註&lt;/strong>：Hallucination 的研究跟降低技術仍在快速演進、不同模型、不同任務類型的 hallucination rate 變化大、引用前以最新研究跟具體 model card 為準。Stanford &lt;a href="https://arxiv.org/abs/2109.07958">TruthfulQA&lt;/a> 等 benchmark 是常見參考。&lt;/p>&lt;/blockquote>
&lt;h2 id="設計責任">設計責任&lt;/h2>
&lt;p>理解 hallucination 後可以解釋兩個現象：為什麼 LLM 給的「具體事實」（人名 / 數字 / 引用）特別要驗證（生成機制本身就會虛構）、為什麼 LLM 寫的 code 看似合理但 import 不存在的 package（hallucinate 出 library API）。&lt;/p>
&lt;p>production 場景下、hallucination 影響合規（生成包含真人 PII 的虛構內容仍是 PII 處理）、UX（使用者照抄誤導內容）、安全（生成假 URL 引發釣魚）；應對策略不是「擋住 hallucination」、是「降低觸發率 + 下游驗證 + 適當的 disclaimer」。詳見 &lt;a href="https://tarrragon.github.io/blog/backend/07-security-data-protection/llm-log-and-pii-governance/" data-link-title="LLM Log 與 PII 治理" data-link-desc="production LLM 服務的 prompt log 累積、PII 偵測與過濾、保留期限與合規對齊">LLM Log 與 PII 治理&lt;/a>。&lt;/p></description><content:encoded><![CDATA[<p>Hallucination 的核心概念是「LLM 生成的內容語法、語氣、結構看起來合理、但內容上是事實錯誤、引用不存在的來源、虛構不存在的 entity」。這是 LLM 基於統計分布生成的固有特性；以目前的研究跟工程實踐、靠「更大模型」或「更好對齊」很難徹底消除、可控的做法是用工程手段降低觸發率跟下游偵測。</p>
<h2 id="概念位置">概念位置</h2>
<p>Hallucination 的常見形態：</p>
<table>
  <thead>
      <tr>
          <th>形態</th>
          <th>例子</th>
          <th>風險</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td>虛構引用</td>
          <td>引用不存在的論文 / API / 函式名稱</td>
          <td>使用者照抄、出錯</td>
      </tr>
      <tr>
          <td>虛構 entity</td>
          <td>虛構不存在的公司 / 人名 / 地址</td>
          <td>寫入文件、產生誤導</td>
      </tr>
      <tr>
          <td>數值幻覺</td>
          <td>給看似精確但實際錯誤的數字</td>
          <td>商業 / 工程決策被誤導</td>
      </tr>
      <tr>
          <td>因果幻覺</td>
          <td>編造看似合理但不存在的因果關係</td>
          <td>推理鏈不可信</td>
      </tr>
      <tr>
          <td>法律 / 醫療幻覺</td>
          <td>虛構不存在的法條 / 治療方案</td>
          <td>高風險領域、可能造成實際傷害</td>
      </tr>
  </tbody>
</table>
<p>降低 / 偵測 hallucination 的常見手段（依場景變化）：</p>
<ol>
<li><strong><a href="/blog/llm/knowledge-cards/rag/" data-link-title="RAG" data-link-desc="Retrieval-Augmented Generation：動態外掛知識給 LLM、繞開模型參數記憶的靜態限制">RAG</a></strong>：把真實內容檢索後注入 prompt、模型基於真實內容生成。</li>
<li><strong>temperature 降低</strong>：採樣較保守、減少創造性但也減少幻覺。</li>
<li><strong>citation 要求</strong>：prompt 要求列出引用、後續可驗證。</li>
<li><strong>下游驗證</strong>：對輸出做事實檢查（如 code 跑 compiler、引用查實際資料庫）。</li>
<li><strong>明確的「不知道就說不知道」instruction</strong>：降低過度自信、但不能消除。</li>
</ol>
<blockquote>
<p><strong>事實查核註</strong>：Hallucination 的研究跟降低技術仍在快速演進、不同模型、不同任務類型的 hallucination rate 變化大、引用前以最新研究跟具體 model card 為準。Stanford <a href="https://arxiv.org/abs/2109.07958">TruthfulQA</a> 等 benchmark 是常見參考。</p></blockquote>
<h2 id="設計責任">設計責任</h2>
<p>理解 hallucination 後可以解釋兩個現象：為什麼 LLM 給的「具體事實」（人名 / 數字 / 引用）特別要驗證（生成機制本身就會虛構）、為什麼 LLM 寫的 code 看似合理但 import 不存在的 package（hallucinate 出 library API）。</p>
<p>production 場景下、hallucination 影響合規（生成包含真人 PII 的虛構內容仍是 PII 處理）、UX（使用者照抄誤導內容）、安全（生成假 URL 引發釣魚）；應對策略不是「擋住 hallucination」、是「降低觸發率 + 下游驗證 + 適當的 disclaimer」。詳見 <a href="/blog/backend/07-security-data-protection/llm-log-and-pii-governance/" data-link-title="LLM Log 與 PII 治理" data-link-desc="production LLM 服務的 prompt log 累積、PII 偵測與過濾、保留期限與合規對齊">LLM Log 與 PII 治理</a>。</p>
]]></content:encoded></item></channel></rss>