重點優先陳述是跨語言的資訊結構原則、不是中文句型問題

2026-06-14

結論

正向陳述優先的本質是資訊結構效率：讀者拿到核心概念的認知步驟越少越好。「不是 X、而是 Y」表達能力差、是因為它讓讀者先處理一個被否定的錯誤理解 X、才拿到正確的 Y —— 重點後置、多繞一步。問題的根本在資訊結構、不在中文特有的句型、也不在主觀品味。

這個校正很重要、因為它決定了解法的方向：把問題定位成「中文句型」、會去抓句型變體或換語言；定位成「品味」、會去靠主觀判定或異源視角；定位成「資訊結構效率」、才會去檢查「核心概念在不在最前」這個跨語言、可操作的判準。

證偽過的反例假設：「換語言能打破」

一個自然的假設：如果「不是 X、而是 Y」是 LLM 中文訓練語料的高頻行為、那換英文或日文思考就能打破。這個假設值得驗、但證偽了。

語言	對應句型	密度
中文	不是 X、而是 Y	高
英文	not X but rather Y、it’s not that X but Y、rather than X	學術 / 技術修辭傳統的核心愛用句、可能更高
日文	X ではなく Y、A というより、むしろ B	高

LLM 在三種語言都從語料學到對應的高頻版本、換語言不打破、英文甚至可能更嚴重。

這個證偽的價值不在「結論是否定的」、在它把問題釘到正確的層：如果這個句型跨語言都在、那本質就不在「某種語言的句型」、而在所有語言共享的資訊結構偏好（重點後置讀起來「優雅」、但效率次優）。

判別線：重點位置統一了對照句的判定

核心概念在不在句首、是判別對照句合不合規的單一判準：

句型	重點位置	判定	既有卡
「X、不是 Y」	重點 X 先行	合法	#94
「不是 X、而是 Y」	重點 Y 後置	違規	#149 的違規例

判別是「核心概念在不在最前」、不是「否定的角色」（#149 的「概念位置」其實就是這個、本卡正名它為資訊結構的重點優先）、不是「對照刪不刪」（#94）、不是「句型」。一個資訊結構判準涵蓋全部對照句、且涵蓋所有重點後置變體（與其 X 不如 Y、不只 X 更 Y），而句型 grep 永遠枚舉不完。實證在這次的 POS lint pattern：連接詞清單擴了兩次（而是 → 加「— 是」→ 加「不在…而在」）、每次擴完就暴露下一個變體、仍漏第四個「不是 X、是 Y」頓號版；而「、是」頓號版誤判率高（「不是 A、是 B」多為正常列舉）、刻意不補進 pattern —— 正是判準（重點位置）優於窮舉（連接詞）的活證明。完整修法軌跡見 #167 修法是新違規的來源、且常引入同類變體。

這個判準可操作：對每個定義句、找核心概念第一次正面出現的位置、在句首就合規、被擠到「而是」之後就違規。它比「判斷這個否定是建立概念還是對照」客觀得多。

為什麼 LLM 系統性放水：高頻偏置

LLM 從語料學到「不是 X、而是 Y」是高頻、讀起來優雅的表達、於是它的「表達能力評價」把這個句型評為好。問題在高頻不等於資訊結構優 —— 這個句型高頻、是因為它在修辭上有對照張力、好寫好讀；它效率次優、是因為重點後置。兩件事獨立、而 LLM 的評價把前者（高頻 / 優雅）誤當後者（資訊結構好）。

這個偏置跨語言、且作者與 reviewer 共享（都是 LLM、學同一類語料）。所以 LLM reviewer 讀到這個句型覺得「自然、好」、跳過重點位置判準、走「讀起來優雅就放行」的捷徑。歸因是訓練語料的高頻偏置、比「文體盲區」這個說法更具體可檢驗。

主解：強制執行重點位置判準、異源為輔

本質可操作、所以主解是把重點位置判準變成不可跳過的機械步驟、不是靠品味、也不是只靠異源視角。

防線層	做法	角色
強制重點位置判準	對每個定義句逐句問「核心概念第一次正面出現在句首、還是被擠到『而是』之後」	主解
文體異源視角	human cold-read / 對抗文體 reviewer（#165）	補充

異源視角是補充、不是唯一解。它補兩種殘餘：強制判準仍漏的、以及無單一重點位置的 register 類（喊話、誇飾 —— 這類回到 #165 的同源上限）。對「重點優先」這個可操作子集、強制執行判準就能抓大部分、不必先跳到「不可機械化、只能靠人」。

存量候選的漸進判讀

把重點位置判準升進工具鏈（mdtools lint 的 POS-negation-lead 警告層、見 markdown-writing-spec 否定起手候選掃描段）之後、全 content/ 約 300 個重點後置候選一次曝光 —— 它們之前 silent、靠 review 記憶才偶爾 catch。曝光本身就是價值（候選在每次 lint 持續可見、不再靠記憶）、判讀則漸進進行：

不一次清倉：300 裡多數是合法對照（核心概念已先行、「不是 X、而是 Y」只是補充）或 meta / 引用（講此句型的卡與規範），真違規只是子集 —— 一次性全判 ROI 遞減。
changed-set scoped 漸進：規則讓候選在每次 lint 持續可見、碰到含 POS 警告的檔時用上面三類判準順手判、真違規改重點先行。這是 markdown-writing-spec 位置引用掃描段與否定起手掃描段的存量處理原則。
本卡承擔這個漸進工作的 backlog：判讀協議（重點位置 + 三類處置）寫在這、未來遇到候選的人讀本卡就知道怎麼判、不需要另開記錄文件。report 卡比單純的記錄文件更有條理 —— 原則、判讀協議、落地狀態收在同一處。

沒這樣做的麻煩

在語言層找解、治不了跨語言的問題

把問題定位成「中文句型」、就會去補 grep 抓句型變體、或想換語言打破。句型 grep 枚舉不完、換語言不打破（證偽過）—— 兩條都在語言層用力、而問題在跨語言的資訊結構層。

把可操作問題誤診成品味上限

把「重點位置」這個可操作判準、誤診成「不可機械化的品味、只能靠異源」（#165 的過度推論）、就會放棄判準、過度依賴異源。實際上強制執行重點位置判準就能抓大部分 —— 這是把 execution gap（有判準沒執行）誤判成 design 上限（判準不存在）、正是 #153 警告的診斷錯誤。

高頻偏置讓「優雅」變成放行藉口

reviewer 用「這句讀起來優雅 / 自然」當放行理由、等於用高頻偏置覆蓋資訊結構判準。優雅與效率是兩件事、要分開問。

跟其他抽象層原則的關係

#165 register 違規：偵測可機械化、判定要靠文體異源：本卡是 #165 的上層、並校正它兩個過度推論。#165 揭露「同源 LLM 漏 register 違規」這個現象、有價值；但它把解過度歸到「判定不可機械化、異源是唯一結構解」。本卡指出「不是 X、而是 Y」這個子集的本質是可操作的資訊結構判準（重點位置）、主解是強制執行、異源降為補充。#165 對喊話 / 誇飾這類無單一重點位置的 register 仍成立、本卡聚焦「重點優先」這個可操作子集。
#149 keyword bank 命中是候選、不是判決：#149 的「概念位置判定」其實就是重點位置、本卡把它正名為「資訊結構的重點優先」、並指出它跨語言、可操作。#149 停在「用概念位置判定」、本卡補「為什麼判定會跳過（高頻偏置）」與「怎麼強制執行」。
#167 修法是新違規的來源、且常引入同類變體：本卡是靜態原則（句型枚舉不完、判準是重點位置）、#167 是它的過程面 —— 修法 / 補 pattern 的動作反覆暴露同類變體（這次 POS pattern 連接詞清單擴兩次仍漏第四個的軌跡），收斂靠本卡的重點位置判準、不靠窮舉連接詞。
#94 正向改寫要保留對照論據：本卡統一 #94 與 #149 的判別線。#94 的「X、不是 Y」是重點先行（合法）、#149 的「不是 X、而是 Y」是重點後置（違規）—— 兩者的判別線是同一個「重點位置」、不是兩條獨立規則。
#153 Review 漏抓先分 design gap 與 execution gap：本卡是 #153 的一個實證 —— #165 把「reviewer 有判準（概念位置）卻沒執行」（execution gap）誤診成「判定不可機械化」（design 上限）。本卡校正回 execution + 可操作判準。
#82 字面攔截 vs 行為精修：重點位置是行為層判準（讀者拿到核心要幾個認知步驟）、比字面層（grep「不是…而是」句型）更本質、且跨語言。grep 抓字面句型、重點位置判讀者的認知成本。

判讀徵兆

徵兆	該做的行動
對某寫作問題在「語言 / 句型」層找解（換語言、grep 句型變體）	退一步問「本質是不是跨語言的資訊結構問題」、在語言層找不到根本解
「不是 X、而是 Y / 與其 X 不如 Y / 不只 X 更 Y」	找核心概念第一次正面出現的位置、後置就前置
reviewer 覺得某句「讀起來優雅 / 自然」就放行	警惕高頻偏置 —— 優雅與資訊結構效率是兩件事、用重點位置判準覆核
把寫作問題歸到「不可機械化、只能靠人 / 異源」	先確認是不是有可操作的結構判準被跳過（execution）、別太快宣告 design 上限

適用範圍與邊界

適用：對照句 / 定義句的重點位置（不是…而是、與其…不如、不只…更）；跨語言寫作；技術 / 教學文（重點優先最該成立的 surface）。
不適用：敘事 / 懸念類寫作（先鋪陳後揭重點是設計、不是缺陷）；無單一「重點」的純列舉。
邊界：「重點優先」是可操作判準、但「哪個是重點」仍需理解內容 —— 可操作指「一旦識別重點、位置判定客觀」、不是「全自動無需理解」。對喊話 / 誇飾這類非重點位置的 register、回到 #165 的異源補充。

Self-case：本卡的觸發來源

本卡觸發於 #165 寫完之後、使用者的追問：如果「不是 X、而是 Y」是 LLM 中文訓練出來的行為、換英文或日文思考能不能打破？這個假設的證偽（英 / 日文同樣高頻、英文修辭傳統尤甚）、把問題從「中文句型」釘到「跨語言資訊結構」。使用者並指出真需求是「正面語境描述 + 重點優先陳述」、本質是這個句型表達能力差（重點後置）、不是對抗特定句型。

這校正了 #165 的兩個過度推論：本質可操作（重點位置、跨語言）、不是不可機械化的品味；主解是強制執行重點位置判準、不是異源唯一。記錄這次「把可操作問題誤診成品味上限」的校正 —— 它跟同批 retrospective 第一輪「把問題過度工具化（補 grep）」對稱、兩次都偏離中道（一次過度工具化、一次過度玄學化）、由使用者連續追問拉回（見 memory root-cause-over-toolification）。

#report #事後檢討 #工程方法論 #寫作 #原則