地區用語對齊:寫作前先確定讀者的中文語料
論述基礎與限制
本卡的論述基於 1 個 case(dart Stream 事故的 review 中讀者點出「副屏」是中國用語)抽出來的觀察。具體限制:
- 詞庫表是分布偏差、不是絕對對立:「函數 vs 函式」「介面 vs 接口」這類詞在兩岸都有人用、只是分布偏好不同。本卡的「漂移代價」是觀察性敘述、不是嚴格的語言學分類
- 部分詞的判定可能不準:例如「文件」在台灣 IT 圈也常用來指 file(Windows 檔案總管的「文件」資料夾用了二十年)、「視頻」近年也滲透台灣年輕人語料——本卡列為「中國用語」是偏向 IT 業界傳統用法的 heuristic、不適用所有讀者群
- 沒有量化資料支撐「對映成本」:本卡描述「累積性的微秒級對映成本」是直覺論述、未做使用者測試
- 預設台灣讀者:本卡用「對台灣讀者寫作」當預設、實際讀者群可能跨地區、預設單一地區可能 over-narrow
讀者使用本卡時、把詞庫表當「這個 blog 為台灣 IT 工程師讀者預設的用詞偏好」、不當「兩岸標準語料對照表」。
核心原則
中文技術寫作的用詞精度受讀者的地區語料影響——同一個概念在繁中跟簡中可能用完全不同的詞、或用同一個詞但語意稍微偏移。寫作前先確定讀者的中文語料、避免用對方語料中不存在或意思偏移的詞。
| 概念類別 | 繁中(台灣) | 簡中(中國) | 漂移代價 |
|---|---|---|---|
| 硬體 / 顯示 | 螢幕 / 副螢幕 | 屏 / 副屏 | 讀者要多花一次對映、且暗示寫作者地區 |
| 檔案系統 | 檔案 / 資料夾 | 文件 / 文件夾 | 「文件」在繁中既可指 document(公文書)、也可指 file(檔案總管的「文件」資料夾)、用法分歧 |
| 預設值 | 預設 | 默認 | 「默認」在繁中是「沉默接受」、語意不同 |
| 品質 / 質量 | 品質 | 質量 | 「質量」在繁中是 mass / weight、技術文章誤用嚴重 |
| 視訊 / 影片 | 影片 / 視訊 | 視頻 / 視屏 | 「視頻」在繁中傳統較少用、但近年滲透增加 |
| 程式設計術語 | 函式 / 變數 | 函數 / 變量 | 「函數」「函式」兩岸都通用、但業界(尤其 Dart / Swift / TypeScript 社群)偏好「函式」 |
| 業務術語 | 訂單 / 結帳 | 訂單 / 收銀 | 「收銀」兩邊通用、但「結帳」在繁中更常用 |
| 介面 / 接口 | 介面 | 接口 | 「介面」在繁中明確指 interface |
| 內存 / 記憶體 | 記憶體 | 內存 | 「內存」在繁中是「內部存放」、不是 memory |
技術文章的精度標準是「讀者用自己的語料能正確 parse 你的句子」。用錯地區用語、輕則增加讀者的對映成本(雖然可讀但不順)、重則造成語意誤判(如「文件」當 file 用、繁中讀者預期是 document)。
為什麼地區用語會漂移
來源 1:訓練語料 / 參考材料來源
技術寫作者常從中國技術社群、AI 工具(早期 LLM 的中文訓練資料以簡中為主)、open source 文件抓參考材料。複製時容易帶進原語料的用詞。
來源 2:技術圈的 Stack Overflow 效應
部分技術術語在簡中社群有大量內容、繁中相對少。寫作時搜尋資料、看到簡中版本的解釋、不自覺套用對方用詞。
來源 3:「讀得懂就好」的低估
「副屏 vs 副螢幕、讀者應該都看得懂」——這個假設在「個別詞」層級成立、但在「整篇文章」層級會累積:每個詞累積一次對映成本、整篇加起來幾十個詞、讀者的認知負擔會增加。
來源 4:跨地區團隊的混合語料
跨地區團隊(台灣 + 中國 + 香港 + 馬來西亞)的工程師常混用兩邊用詞。內部溝通沒問題、但寫成對外文章時要選定一個地區的語料對齊。
識別訊號:什麼時候你在用錯地區用語
訊號 1:技術術語有兩個常見譯法
「函式 vs 函數」「介面 vs 接口」「預設 vs 默認」「記憶體 vs 內存」——這類詞兩邊都有用、但分布偏向不同地區。
修法:選定讀者地區的版本、全篇統一。對台灣讀者寫作時用「函式 / 介面 / 預設 / 記憶體」。
訊號 2:硬體 / 業務名詞用了單字版本
「屏」「網盤」「U 盤」「光盤」——簡中習慣用單字、繁中習慣用兩字以上。
修法:「螢幕 / 雲端硬碟 / USB 隨身碟 / 光碟」。
訊號 3:「質量」當品質用
「程式碼質量」「服務質量」——繁中「質量」是 mass、用「品質」較精確。
修法:technical quality → 品質;mass / weight → 質量。
訊號 4:「視頻 / 視屏」用在繁中文章
「教學視頻」「示範視屏」——繁中傳統用「影片」、但「視頻」近年滲透。對 IT 工程師讀者寫作時、用「影片」更貼合主流偏好。
訊號 5:「文件」當 file 用的歧義
「打開這個文件」「保存文件」——繁中的「文件」用法分歧(IT 業界常用「檔案」指 file、但日常 / Windows 檔案總管也用「文件」指資料夾)。寫作時若指 file、用「檔案」更明確。
修法:file → 檔案(避免歧義);document(公文 / 報告)→ 文件。
何時混用 / 不嚴格對齊仍然合理
「地區用語對齊」這條原則在公開技術文章成立、但有合理例外:
| 情境 | 為什麼可以混用 |
|---|---|
| 引用第三方資料 / quote | 引用 Apple Developer 的中文文件用「默認」、保留原文準確性比對齊重要 |
| 業界共同術語(不分地區) | 「Bug」「commit」「pull request」這類本身就是英文、不在語料漂移範圍 |
| 內部團隊溝通 / 工作日誌 | 寫給知道讀者語料的特定群體、混用不損精度 |
| 描述對方地區的具體系統 | 「微信公眾號」「百度網盤」是大陸專有名詞、不該翻成台灣用詞 |
| 引用作者自身用詞 / 個人風格保留 | 訪談記錄 / 個人 blog 保留作者自己的語感是 narrative 選擇 |
判讀:寫之前自問「讀者地區是否單一?我的用詞是否會讓讀者多花認知對映?」——是 → 嚴格對齊;否 → 混用可接受。
推到「術語選擇」的更上位原則
地區用語對齊是「術語選擇」的子問題。更上位的原則:
每個技術詞、寫之前都該確認「讀者語料是否包含這個詞」。
這個自問適用於:
- 地區漂移:本卡主題(繁中 vs 簡中)
- 學術 vs 業界用詞:「方法論」(學術)vs「做法」(業界)
- 新舊術語:「響應式設計」(舊)vs「reactive 設計」(業界新)
- 中文 vs 英文:技術術語第一次出現要不要保留原文錨點(見 #107 術語翻譯要保留原文錨點)
- 完整名詞頭:壓縮中文術語要保留 head noun(見 #108 中文壓縮術語要保留完整名詞頭)
地區漂移是這個自問的第一層應用——讀者語料的最大差異訊號。
跟其他抽象層原則的關係
| 原則 | 跟本卡的關係 |
|---|---|
| #107 術語翻譯要保留原文錨點 | 兩卡都處理「讀者語料 ↔ 寫作用詞」對齊、本卡聚焦地區、#107 聚焦中英對應 |
| #108 中文壓縮術語要保留完整名詞頭 | 本卡是「術語完整性」的地區層、#108 是「術語完整性」的壓縮層 |
| #109 術語翻譯要保留概念角色 | 本卡是「概念→中文」的地區層、#109 是「概念→中文」的角色層 |
| #111 口語化修辭會稀釋技術精度 | 兩卡都處理「字句層級的精度」、本卡是地區漂移、#111 是修辭漂移 |
判讀徵兆
| 訊號 | 該做的行動 |
|---|---|
| 用「屏 / 默認 / 質量 / 視頻 / 文件」這類詞 | 換成「螢幕 / 預設 / 品質 / 影片 / 檔案」 |
| 文章寫給台灣讀者、但混用兩邊用詞 | 全篇 grep 替換、選定一個地區語料 |
| 從中國技術文章複製範例 / 解釋 | 翻譯時連用詞一起翻、不只翻句子 |
| 用了某詞但不確定是不是地區漂移 | grep 「某詞 + 台灣 / 香港 + 中文」看用法分布 |
| 內部討論用 A、寫對外文章用 B | 對外文章固定用讀者地區的版本、內部討論可寬鬆 |
核心原則:技術寫作的精度標準是「讀者用自己的語料能正確 parse」。地區用語漂移是累積性的閱讀流暢度損失——單一詞對映成本不大、但整篇加起來顯著。寫前先確定讀者地區、寫完跑一次 grep 對齊。
Self-case:本卡的觸發來源
本卡的觸發是修 Dart StreamController:single-subscription vs broadcast 的事故實錄 時、讀者指出「副屏」是中國用語、台灣應該用「副螢幕」。
修補時 grep 全文、發現「副屏」出現 9 處——不是孤立的一個詞、是整篇貫穿的用詞選擇。修補方式是 batch replace。
對應本卡:地區漂移多半不是孤立的、會在整篇文章貫穿——修補要用 grep 而不是逐句改。寫作前先確定讀者地區、寫完跑一次地區用語 sweep。