<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>地區化 on Tarragon</title><link>https://tarrragon.github.io/blog/tags/%E5%9C%B0%E5%8D%80%E5%8C%96/</link><description>Recent content in 地區化 on Tarragon</description><generator>Hugo -- gohugo.io</generator><language>zh-TW</language><copyright>Tarragon (CC BY 4.0)</copyright><lastBuildDate>Wed, 06 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://tarrragon.github.io/blog/tags/%E5%9C%B0%E5%8D%80%E5%8C%96/index.xml" rel="self" type="application/rss+xml"/><item><title>地區用語對齊：寫作前先確定讀者的中文語料</title><link>https://tarrragon.github.io/blog/report/regional-terminology-alignment/</link><pubDate>Wed, 06 May 2026 00:00:00 +0000</pubDate><guid>https://tarrragon.github.io/blog/report/regional-terminology-alignment/</guid><description>&lt;h2 id="論述基礎與限制">論述基礎與限制&lt;/h2>
&lt;p>本卡的論述基於 &lt;strong>1 個 case&lt;/strong>（&lt;a href="../../work-log/dart_stream_controller_single_vs_broadcast/">dart Stream 事故的 review&lt;/a> 中讀者點出「副屏」是中國用語）抽出來的觀察。具體限制：&lt;/p>
&lt;ul>
&lt;li>&lt;strong>詞庫表是分布偏差、不是絕對對立&lt;/strong>：「函數 vs 函式」「介面 vs 接口」這類詞在兩岸都有人用、只是分布偏好不同。本卡的「漂移代價」是觀察性敘述、不是嚴格的語言學分類&lt;/li>
&lt;li>&lt;strong>部分詞的判定可能不準&lt;/strong>：例如「文件」在台灣 IT 圈也常用來指 file（Windows 檔案總管的「文件」資料夾用了二十年）、「視頻」近年也滲透台灣年輕人語料——本卡列為「中國用語」是偏向 IT 業界傳統用法的 heuristic、不適用所有讀者群&lt;/li>
&lt;li>&lt;strong>沒有量化資料支撐「對映成本」&lt;/strong>：本卡描述「累積性的微秒級對映成本」是直覺論述、未做使用者測試&lt;/li>
&lt;li>&lt;strong>預設台灣讀者&lt;/strong>：本卡用「對台灣讀者寫作」當預設、實際讀者群可能跨地區、預設單一地區可能 over-narrow&lt;/li>
&lt;/ul>
&lt;p>讀者使用本卡時、把詞庫表當「&lt;strong>這個 blog 為台灣 IT 工程師讀者預設的用詞偏好&lt;/strong>」、不當「兩岸標準語料對照表」。&lt;/p>
&lt;hr>
&lt;h2 id="核心原則">核心原則&lt;/h2>
&lt;p>中文技術寫作的用詞精度受&lt;strong>讀者的地區語料&lt;/strong>影響——同一個概念在繁中跟簡中可能用完全不同的詞、或用同一個詞但語意稍微偏移。寫作前先確定讀者的中文語料、避免用對方語料中不存在或意思偏移的詞。&lt;/p>
&lt;table>
 &lt;thead>
 &lt;tr>
 &lt;th>概念類別&lt;/th>
 &lt;th>繁中（台灣）&lt;/th>
 &lt;th>簡中（中國）&lt;/th>
 &lt;th>漂移代價&lt;/th>
 &lt;/tr>
 &lt;/thead>
 &lt;tbody>
 &lt;tr>
 &lt;td>硬體 / 顯示&lt;/td>
 &lt;td>螢幕 / 副螢幕&lt;/td>
 &lt;td>屏 / 副屏&lt;/td>
 &lt;td>讀者要多花一次對映、且暗示寫作者地區&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>檔案系統&lt;/td>
 &lt;td>檔案 / 資料夾&lt;/td>
 &lt;td>文件 / 文件夾&lt;/td>
 &lt;td>「文件」在繁中既可指 document（公文書）、也可指 file（檔案總管的「文件」資料夾）、用法分歧&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>預設值&lt;/td>
 &lt;td>預設&lt;/td>
 &lt;td>默認&lt;/td>
 &lt;td>「默認」在繁中是「沉默接受」、語意不同&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>品質 / 質量&lt;/td>
 &lt;td>品質&lt;/td>
 &lt;td>質量&lt;/td>
 &lt;td>「質量」在繁中是 mass / weight、技術文章誤用嚴重&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>視訊 / 影片&lt;/td>
 &lt;td>影片 / 視訊&lt;/td>
 &lt;td>視頻 / 視屏&lt;/td>
 &lt;td>「視頻」在繁中傳統較少用、但近年滲透增加&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>程式設計術語&lt;/td>
 &lt;td>函式 / 變數&lt;/td>
 &lt;td>函數 / 變量&lt;/td>
 &lt;td>「函數」「函式」兩岸都通用、但業界（尤其 Dart / Swift / TypeScript 社群）偏好「函式」&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>業務術語&lt;/td>
 &lt;td>訂單 / 結帳&lt;/td>
 &lt;td>訂單 / 收銀&lt;/td>
 &lt;td>「收銀」兩邊通用、但「結帳」在繁中更常用&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>介面 / 接口&lt;/td>
 &lt;td>介面&lt;/td>
 &lt;td>接口&lt;/td>
 &lt;td>「介面」在繁中明確指 interface&lt;/td>
 &lt;/tr>
 &lt;tr>
 &lt;td>內存 / 記憶體&lt;/td>
 &lt;td>記憶體&lt;/td>
 &lt;td>內存&lt;/td>
 &lt;td>「內存」在繁中是「內部存放」、不是 memory&lt;/td>
 &lt;/tr>
 &lt;/tbody>
&lt;/table>
&lt;p>技術文章的精度標準是「&lt;strong>讀者用自己的語料能正確 parse 你的句子&lt;/strong>」。用錯地區用語、輕則增加讀者的對映成本（雖然可讀但不順）、重則造成語意誤判（如「文件」當 file 用、繁中讀者預期是 document）。&lt;/p>
&lt;hr>
&lt;h2 id="為什麼地區用語會漂移">為什麼地區用語會漂移&lt;/h2>
&lt;h3 id="來源-1訓練語料--參考材料來源">來源 1：訓練語料 / 參考材料來源&lt;/h3>
&lt;p>技術寫作者常從中國技術社群、AI 工具（早期 LLM 的中文訓練資料以簡中為主）、open source 文件抓參考材料。複製時容易帶進原語料的用詞。&lt;/p>
&lt;h3 id="來源-2技術圈的-stack-overflow-效應">來源 2：技術圈的 Stack Overflow 效應&lt;/h3>
&lt;p>部分技術術語在簡中社群有大量內容、繁中相對少。寫作時搜尋資料、看到簡中版本的解釋、不自覺套用對方用詞。&lt;/p>
&lt;h3 id="來源-3讀得懂就好的低估">來源 3：「讀得懂就好」的低估&lt;/h3>
&lt;p>「副屏 vs 副螢幕、讀者應該都看得懂」——這個假設在「個別詞」層級成立、但在「整篇文章」層級會累積：每個詞累積一次對映成本、整篇加起來幾十個詞、讀者的認知負擔會增加。&lt;/p>
&lt;h3 id="來源-4跨地區團隊的混合語料">來源 4：跨地區團隊的混合語料&lt;/h3>
&lt;p>跨地區團隊（台灣 + 中國 + 香港 + 馬來西亞）的工程師常混用兩邊用詞。內部溝通沒問題、但寫成對外文章時要選定一個地區的語料對齊。&lt;/p>
&lt;hr>
&lt;h2 id="識別訊號什麼時候你在用錯地區用語">識別訊號：什麼時候你在用錯地區用語&lt;/h2>
&lt;h3 id="訊號-1技術術語有兩個常見譯法">訊號 1：技術術語有兩個常見譯法&lt;/h3>
&lt;p>「函式 vs 函數」「介面 vs 接口」「預設 vs 默認」「記憶體 vs 內存」——這類詞兩邊都有用、但分布偏向不同地區。&lt;/p>
&lt;p>修法：選定讀者地區的版本、全篇統一。對台灣讀者寫作時用「函式 / 介面 / 預設 / 記憶體」。&lt;/p>
&lt;h3 id="訊號-2硬體--業務名詞用了單字版本">訊號 2：硬體 / 業務名詞用了單字版本&lt;/h3>
&lt;p>「屏」「網盤」「U 盤」「光盤」——簡中習慣用單字、繁中習慣用兩字以上。&lt;/p>
&lt;p>修法：「螢幕 / 雲端硬碟 / USB 隨身碟 / 光碟」。&lt;/p>
&lt;h3 id="訊號-3質量當品質用">訊號 3:「質量」當品質用&lt;/h3>
&lt;p>「程式碼質量」「服務質量」——繁中「質量」是 mass、用「品質」較精確。&lt;/p>
&lt;p>修法：technical quality → 品質；mass / weight → 質量。&lt;/p>
&lt;h3 id="訊號-4視頻--視屏用在繁中文章">訊號 4：「視頻 / 視屏」用在繁中文章&lt;/h3>
&lt;p>「教學視頻」「示範視屏」——繁中傳統用「影片」、但「視頻」近年滲透。對 IT 工程師讀者寫作時、用「影片」更貼合主流偏好。&lt;/p></description><content:encoded><![CDATA[<h2 id="論述基礎與限制">論述基礎與限制</h2>
<p>本卡的論述基於 <strong>1 個 case</strong>（<a href="../../work-log/dart_stream_controller_single_vs_broadcast/">dart Stream 事故的 review</a> 中讀者點出「副屏」是中國用語）抽出來的觀察。具體限制：</p>
<ul>
<li><strong>詞庫表是分布偏差、不是絕對對立</strong>：「函數 vs 函式」「介面 vs 接口」這類詞在兩岸都有人用、只是分布偏好不同。本卡的「漂移代價」是觀察性敘述、不是嚴格的語言學分類</li>
<li><strong>部分詞的判定可能不準</strong>：例如「文件」在台灣 IT 圈也常用來指 file（Windows 檔案總管的「文件」資料夾用了二十年）、「視頻」近年也滲透台灣年輕人語料——本卡列為「中國用語」是偏向 IT 業界傳統用法的 heuristic、不適用所有讀者群</li>
<li><strong>沒有量化資料支撐「對映成本」</strong>：本卡描述「累積性的微秒級對映成本」是直覺論述、未做使用者測試</li>
<li><strong>預設台灣讀者</strong>：本卡用「對台灣讀者寫作」當預設、實際讀者群可能跨地區、預設單一地區可能 over-narrow</li>
</ul>
<p>讀者使用本卡時、把詞庫表當「<strong>這個 blog 為台灣 IT 工程師讀者預設的用詞偏好</strong>」、不當「兩岸標準語料對照表」。</p>
<hr>
<h2 id="核心原則">核心原則</h2>
<p>中文技術寫作的用詞精度受<strong>讀者的地區語料</strong>影響——同一個概念在繁中跟簡中可能用完全不同的詞、或用同一個詞但語意稍微偏移。寫作前先確定讀者的中文語料、避免用對方語料中不存在或意思偏移的詞。</p>
<table>
  <thead>
      <tr>
          <th>概念類別</th>
          <th>繁中（台灣）</th>
          <th>簡中（中國）</th>
          <th>漂移代價</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td>硬體 / 顯示</td>
          <td>螢幕 / 副螢幕</td>
          <td>屏 / 副屏</td>
          <td>讀者要多花一次對映、且暗示寫作者地區</td>
      </tr>
      <tr>
          <td>檔案系統</td>
          <td>檔案 / 資料夾</td>
          <td>文件 / 文件夾</td>
          <td>「文件」在繁中既可指 document（公文書）、也可指 file（檔案總管的「文件」資料夾）、用法分歧</td>
      </tr>
      <tr>
          <td>預設值</td>
          <td>預設</td>
          <td>默認</td>
          <td>「默認」在繁中是「沉默接受」、語意不同</td>
      </tr>
      <tr>
          <td>品質 / 質量</td>
          <td>品質</td>
          <td>質量</td>
          <td>「質量」在繁中是 mass / weight、技術文章誤用嚴重</td>
      </tr>
      <tr>
          <td>視訊 / 影片</td>
          <td>影片 / 視訊</td>
          <td>視頻 / 視屏</td>
          <td>「視頻」在繁中傳統較少用、但近年滲透增加</td>
      </tr>
      <tr>
          <td>程式設計術語</td>
          <td>函式 / 變數</td>
          <td>函數 / 變量</td>
          <td>「函數」「函式」兩岸都通用、但業界（尤其 Dart / Swift / TypeScript 社群）偏好「函式」</td>
      </tr>
      <tr>
          <td>業務術語</td>
          <td>訂單 / 結帳</td>
          <td>訂單 / 收銀</td>
          <td>「收銀」兩邊通用、但「結帳」在繁中更常用</td>
      </tr>
      <tr>
          <td>介面 / 接口</td>
          <td>介面</td>
          <td>接口</td>
          <td>「介面」在繁中明確指 interface</td>
      </tr>
      <tr>
          <td>內存 / 記憶體</td>
          <td>記憶體</td>
          <td>內存</td>
          <td>「內存」在繁中是「內部存放」、不是 memory</td>
      </tr>
  </tbody>
</table>
<p>技術文章的精度標準是「<strong>讀者用自己的語料能正確 parse 你的句子</strong>」。用錯地區用語、輕則增加讀者的對映成本（雖然可讀但不順）、重則造成語意誤判（如「文件」當 file 用、繁中讀者預期是 document）。</p>
<hr>
<h2 id="為什麼地區用語會漂移">為什麼地區用語會漂移</h2>
<h3 id="來源-1訓練語料--參考材料來源">來源 1：訓練語料 / 參考材料來源</h3>
<p>技術寫作者常從中國技術社群、AI 工具（早期 LLM 的中文訓練資料以簡中為主）、open source 文件抓參考材料。複製時容易帶進原語料的用詞。</p>
<h3 id="來源-2技術圈的-stack-overflow-效應">來源 2：技術圈的 Stack Overflow 效應</h3>
<p>部分技術術語在簡中社群有大量內容、繁中相對少。寫作時搜尋資料、看到簡中版本的解釋、不自覺套用對方用詞。</p>
<h3 id="來源-3讀得懂就好的低估">來源 3：「讀得懂就好」的低估</h3>
<p>「副屏 vs 副螢幕、讀者應該都看得懂」——這個假設在「個別詞」層級成立、但在「整篇文章」層級會累積：每個詞累積一次對映成本、整篇加起來幾十個詞、讀者的認知負擔會增加。</p>
<h3 id="來源-4跨地區團隊的混合語料">來源 4：跨地區團隊的混合語料</h3>
<p>跨地區團隊（台灣 + 中國 + 香港 + 馬來西亞）的工程師常混用兩邊用詞。內部溝通沒問題、但寫成對外文章時要選定一個地區的語料對齊。</p>
<hr>
<h2 id="識別訊號什麼時候你在用錯地區用語">識別訊號：什麼時候你在用錯地區用語</h2>
<h3 id="訊號-1技術術語有兩個常見譯法">訊號 1：技術術語有兩個常見譯法</h3>
<p>「函式 vs 函數」「介面 vs 接口」「預設 vs 默認」「記憶體 vs 內存」——這類詞兩邊都有用、但分布偏向不同地區。</p>
<p>修法：選定讀者地區的版本、全篇統一。對台灣讀者寫作時用「函式 / 介面 / 預設 / 記憶體」。</p>
<h3 id="訊號-2硬體--業務名詞用了單字版本">訊號 2：硬體 / 業務名詞用了單字版本</h3>
<p>「屏」「網盤」「U 盤」「光盤」——簡中習慣用單字、繁中習慣用兩字以上。</p>
<p>修法：「螢幕 / 雲端硬碟 / USB 隨身碟 / 光碟」。</p>
<h3 id="訊號-3質量當品質用">訊號 3:「質量」當品質用</h3>
<p>「程式碼質量」「服務質量」——繁中「質量」是 mass、用「品質」較精確。</p>
<p>修法：technical quality → 品質；mass / weight → 質量。</p>
<h3 id="訊號-4視頻--視屏用在繁中文章">訊號 4：「視頻 / 視屏」用在繁中文章</h3>
<p>「教學視頻」「示範視屏」——繁中傳統用「影片」、但「視頻」近年滲透。對 IT 工程師讀者寫作時、用「影片」更貼合主流偏好。</p>
<h3 id="訊號-5文件當-file-用的歧義">訊號 5：「文件」當 file 用的歧義</h3>
<p>「打開這個文件」「保存文件」——繁中的「文件」用法分歧（IT 業界常用「檔案」指 file、但日常 / Windows 檔案總管也用「文件」指資料夾）。寫作時若指 file、用「檔案」更明確。</p>
<p>修法：file → 檔案（避免歧義）；document（公文 / 報告）→ 文件。</p>
<hr>
<h2 id="何時混用--不嚴格對齊仍然合理">何時混用 / 不嚴格對齊仍然合理</h2>
<p>「地區用語對齊」這條原則在公開技術文章成立、但有合理例外：</p>
<table>
  <thead>
      <tr>
          <th>情境</th>
          <th>為什麼可以混用</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td>引用第三方資料 / quote</td>
          <td>引用 Apple Developer 的中文文件用「默認」、保留原文準確性比對齊重要</td>
      </tr>
      <tr>
          <td>業界共同術語（不分地區）</td>
          <td>「Bug」「commit」「pull request」這類本身就是英文、不在語料漂移範圍</td>
      </tr>
      <tr>
          <td>內部團隊溝通 / 工作日誌</td>
          <td>寫給知道讀者語料的特定群體、混用不損精度</td>
      </tr>
      <tr>
          <td>描述對方地區的具體系統</td>
          <td>「微信公眾號」「百度網盤」是大陸專有名詞、不該翻成台灣用詞</td>
      </tr>
      <tr>
          <td>引用作者自身用詞 / 個人風格保留</td>
          <td>訪談記錄 / 個人 blog 保留作者自己的語感是 narrative 選擇</td>
      </tr>
  </tbody>
</table>
<p>判讀：寫之前自問「讀者地區是否單一？我的用詞是否會讓讀者多花認知對映？」——是 → 嚴格對齊；否 → 混用可接受。</p>
<hr>
<h2 id="推到術語選擇的更上位原則">推到「術語選擇」的更上位原則</h2>
<p>地區用語對齊是「術語選擇」的子問題。更上位的原則：</p>
<blockquote>
<p>每個技術詞、寫之前都該確認「<strong>讀者語料是否包含這個詞</strong>」。</p></blockquote>
<p>這個自問適用於：</p>
<ul>
<li><strong>地區漂移</strong>：本卡主題（繁中 vs 簡中）</li>
<li><strong>學術 vs 業界用詞</strong>：「方法論」（學術）vs「做法」（業界）</li>
<li><strong>新舊術語</strong>：「響應式設計」（舊）vs「reactive 設計」（業界新）</li>
<li><strong>中文 vs 英文</strong>：技術術語第一次出現要不要保留原文錨點（見 <a href="../terminology-keeps-original-anchor/">#107 術語翻譯要保留原文錨點</a>）</li>
<li><strong>完整名詞頭</strong>：壓縮中文術語要保留 head noun（見 <a href="../compressed-chinese-terms-need-head-noun/">#108 中文壓縮術語要保留完整名詞頭</a>）</li>
</ul>
<p>地區漂移是這個自問的第一層應用——讀者語料的最大差異訊號。</p>
<hr>
<h2 id="跟其他抽象層原則的關係">跟其他抽象層原則的關係</h2>
<table>
  <thead>
      <tr>
          <th>原則</th>
          <th>跟本卡的關係</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td><a href="../terminology-keeps-original-anchor/">#107 術語翻譯要保留原文錨點</a></td>
          <td>兩卡都處理「讀者語料 ↔ 寫作用詞」對齊、本卡聚焦地區、#107 聚焦中英對應</td>
      </tr>
      <tr>
          <td><a href="../compressed-chinese-terms-need-head-noun/">#108 中文壓縮術語要保留完整名詞頭</a></td>
          <td>本卡是「術語完整性」的地區層、#108 是「術語完整性」的壓縮層</td>
      </tr>
      <tr>
          <td><a href="../translation-must-preserve-concept-role/">#109 術語翻譯要保留概念角色</a></td>
          <td>本卡是「概念→中文」的地區層、#109 是「概念→中文」的角色層</td>
      </tr>
      <tr>
          <td><a href="../colloquial-rhetoric-erodes-technical-precision/">#111 口語化修辭會稀釋技術精度</a></td>
          <td>兩卡都處理「字句層級的精度」、本卡是地區漂移、#111 是修辭漂移</td>
      </tr>
  </tbody>
</table>
<hr>
<h2 id="判讀徵兆">判讀徵兆</h2>
<table>
  <thead>
      <tr>
          <th>訊號</th>
          <th>該做的行動</th>
      </tr>
  </thead>
  <tbody>
      <tr>
          <td>用「屏 / 默認 / 質量 / 視頻 / 文件」這類詞</td>
          <td>換成「螢幕 / 預設 / 品質 / 影片 / 檔案」</td>
      </tr>
      <tr>
          <td>文章寫給台灣讀者、但混用兩邊用詞</td>
          <td>全篇 grep 替換、選定一個地區語料</td>
      </tr>
      <tr>
          <td>從中國技術文章複製範例 / 解釋</td>
          <td>翻譯時連用詞一起翻、不只翻句子</td>
      </tr>
      <tr>
          <td>用了某詞但不確定是不是地區漂移</td>
          <td>grep 「某詞 + 台灣 / 香港 + 中文」看用法分布</td>
      </tr>
      <tr>
          <td>內部討論用 A、寫對外文章用 B</td>
          <td>對外文章固定用讀者地區的版本、內部討論可寬鬆</td>
      </tr>
  </tbody>
</table>
<p><strong>核心原則</strong>：技術寫作的精度標準是「讀者用自己的語料能正確 parse」。地區用語漂移是累積性的閱讀流暢度損失——單一詞對映成本不大、但整篇加起來顯著。寫前先確定讀者地區、寫完跑一次 grep 對齊。</p>
<hr>
<h2 id="self-case本卡的觸發來源">Self-case：本卡的觸發來源</h2>
<p>本卡的觸發是修 <a href="../../work-log/dart_stream_controller_single_vs_broadcast/">Dart StreamController：single-subscription vs broadcast 的事故實錄</a> 時、讀者指出「副屏」是中國用語、台灣應該用「副螢幕」。</p>
<p>修補時 grep 全文、發現「副屏」出現 9 處——不是孤立的一個詞、是整篇貫穿的用詞選擇。修補方式是 batch replace。</p>
<p>對應本卡：<strong>地區漂移多半不是孤立的、會在整篇文章貫穿——修補要用 grep 而不是逐句改。寫作前先確定讀者地區、寫完跑一次地區用語 sweep</strong>。</p>
]]></content:encoded></item></channel></rss>