結論

正向陳述優先的本質是資訊結構效率:讀者拿到核心概念的認知步驟越少越好。「不是 X、而是 Y」表達能力差、是因為它讓讀者先處理一個被否定的錯誤理解 X、才拿到正確的 Y —— 重點後置、多繞一步。問題的根本在資訊結構、不在中文特有的句型、也不在主觀品味。

這個校正很重要、因為它決定了解法的方向:把問題定位成「中文句型」、會去抓句型變體或換語言;定位成「品味」、會去靠主觀判定或異源視角;定位成「資訊結構效率」、才會去檢查「核心概念在不在最前」這個跨語言、可操作的判準。


證偽過的反例假設:「換語言能打破」

一個自然的假設:如果「不是 X、而是 Y」是 LLM 中文訓練語料的高頻行為、那換英文或日文思考就能打破。這個假設值得驗、但證偽了。

語言對應句型密度
中文不是 X、而是 Y
英文not X but rather Y、it’s not that X but Y、rather than X學術 / 技術修辭傳統的核心愛用句、可能更高
日文X ではなく Y、A というより、むしろ B

LLM 在三種語言都從語料學到對應的高頻版本、換語言不打破、英文甚至可能更嚴重。

這個證偽的價值不在「結論是否定的」、在它把問題釘到正確的層:如果這個句型跨語言都在、那本質就不在「某種語言的句型」、而在所有語言共享的資訊結構偏好(重點後置讀起來「優雅」、但效率次優)。


判別線:重點位置統一了對照句的判定

核心概念在不在句首、是判別對照句合不合規的單一判準:

句型重點位置判定既有卡
「X、不是 Y」重點 X 先行合法#94
「不是 X、而是 Y」重點 Y 後置違規#149 的違規例

判別是「核心概念在不在最前」、不是「否定的角色」(#149 的「概念位置」其實就是這個、本卡正名它為資訊結構的重點優先)、不是「對照刪不刪」(#94)、不是「句型」。一個資訊結構判準涵蓋全部對照句、且涵蓋所有重點後置變體(與其 X 不如 Y、不只 X 更 Y),而句型 grep 永遠枚舉不完。實證在這次的 POS lint pattern:連接詞清單擴了兩次(而是 → 加「— 是」→ 加「不在…而在」)、每次擴完就暴露下一個變體、仍漏第四個「不是 X、是 Y」頓號版;而「、是」頓號版誤判率高(「不是 A、是 B」多為正常列舉)、刻意不補進 pattern —— 正是判準(重點位置)優於窮舉(連接詞)的活證明。完整修法軌跡見 #167 修法是新違規的來源、且常引入同類變體

這個判準可操作:對每個定義句、找核心概念第一次正面出現的位置、在句首就合規、被擠到「而是」之後就違規。它比「判斷這個否定是建立概念還是對照」客觀得多。


為什麼 LLM 系統性放水:高頻偏置

LLM 從語料學到「不是 X、而是 Y」是高頻、讀起來優雅的表達、於是它的「表達能力評價」把這個句型評為好。問題在高頻不等於資訊結構優 —— 這個句型高頻、是因為它在修辭上有對照張力、好寫好讀;它效率次優、是因為重點後置。兩件事獨立、而 LLM 的評價把前者(高頻 / 優雅)誤當後者(資訊結構好)。

這個偏置跨語言、且作者與 reviewer 共享(都是 LLM、學同一類語料)。所以 LLM reviewer 讀到這個句型覺得「自然、好」、跳過重點位置判準、走「讀起來優雅就放行」的捷徑。歸因是訓練語料的高頻偏置、比「文體盲區」這個說法更具體可檢驗。


主解:強制執行重點位置判準、異源為輔

本質可操作、所以主解是把重點位置判準變成不可跳過的機械步驟、不是靠品味、也不是只靠異源視角。

防線層做法角色
強制重點位置判準對每個定義句逐句問「核心概念第一次正面出現在句首、還是被擠到『而是』之後」主解
文體異源視角human cold-read / 對抗文體 reviewer(#165補充

異源視角是補充、不是唯一解。它補兩種殘餘:強制判準仍漏的、以及無單一重點位置的 register 類(喊話、誇飾 —— 這類回到 #165 的同源上限)。對「重點優先」這個可操作子集、強制執行判準就能抓大部分、不必先跳到「不可機械化、只能靠人」。


存量候選的漸進判讀

把重點位置判準升進工具鏈(mdtools lint 的 POS-negation-lead 警告層、見 markdown-writing-spec 否定起手候選掃描段)之後、全 content/ 約 300 個重點後置候選一次曝光 —— 它們之前 silent、靠 review 記憶才偶爾 catch。曝光本身就是價值(候選在每次 lint 持續可見、不再靠記憶)、判讀則漸進進行:

  • 不一次清倉:300 裡多數是合法對照(核心概念已先行、「不是 X、而是 Y」只是補充)或 meta / 引用(講此句型的卡與規範),真違規只是子集 —— 一次性全判 ROI 遞減。
  • changed-set scoped 漸進:規則讓候選在每次 lint 持續可見、碰到含 POS 警告的檔時用上面三類判準順手判、真違規改重點先行。這是 markdown-writing-spec 位置引用掃描段與否定起手掃描段的存量處理原則。
  • 本卡承擔這個漸進工作的 backlog:判讀協議(重點位置 + 三類處置)寫在這、未來遇到候選的人讀本卡就知道怎麼判、不需要另開記錄文件。report 卡比單純的記錄文件更有條理 —— 原則、判讀協議、落地狀態收在同一處。

沒這樣做的麻煩

在語言層找解、治不了跨語言的問題

把問題定位成「中文句型」、就會去補 grep 抓句型變體、或想換語言打破。句型 grep 枚舉不完、換語言不打破(證偽過)—— 兩條都在語言層用力、而問題在跨語言的資訊結構層。

把可操作問題誤診成品味上限

把「重點位置」這個可操作判準、誤診成「不可機械化的品味、只能靠異源」(#165 的過度推論)、就會放棄判準、過度依賴異源。實際上強制執行重點位置判準就能抓大部分 —— 這是把 execution gap(有判準沒執行)誤判成 design 上限(判準不存在)、正是 #153 警告的診斷錯誤。

高頻偏置讓「優雅」變成放行藉口

reviewer 用「這句讀起來優雅 / 自然」當放行理由、等於用高頻偏置覆蓋資訊結構判準。優雅與效率是兩件事、要分開問。


跟其他抽象層原則的關係

  • #165 register 違規:偵測可機械化、判定要靠文體異源:本卡是 #165 的上層、並校正它兩個過度推論。#165 揭露「同源 LLM 漏 register 違規」這個現象、有價值;但它把解過度歸到「判定不可機械化、異源是唯一結構解」。本卡指出「不是 X、而是 Y」這個子集的本質是可操作的資訊結構判準(重點位置)、主解是強制執行、異源降為補充。#165 對喊話 / 誇飾這類無單一重點位置的 register 仍成立、本卡聚焦「重點優先」這個可操作子集。
  • #149 keyword bank 命中是候選、不是判決:#149 的「概念位置判定」其實就是重點位置、本卡把它正名為「資訊結構的重點優先」、並指出它跨語言、可操作。#149 停在「用概念位置判定」、本卡補「為什麼判定會跳過(高頻偏置)」與「怎麼強制執行」。
  • #167 修法是新違規的來源、且常引入同類變體:本卡是靜態原則(句型枚舉不完、判準是重點位置)、#167 是它的過程面 —— 修法 / 補 pattern 的動作反覆暴露同類變體(這次 POS pattern 連接詞清單擴兩次仍漏第四個的軌跡),收斂靠本卡的重點位置判準、不靠窮舉連接詞。
  • #94 正向改寫要保留對照論據:本卡統一 #94 與 #149 的判別線。#94 的「X、不是 Y」是重點先行(合法)、#149 的「不是 X、而是 Y」是重點後置(違規)—— 兩者的判別線是同一個「重點位置」、不是兩條獨立規則。
  • #153 Review 漏抓先分 design gap 與 execution gap:本卡是 #153 的一個實證 —— #165 把「reviewer 有判準(概念位置)卻沒執行」(execution gap)誤診成「判定不可機械化」(design 上限)。本卡校正回 execution + 可操作判準。
  • #82 字面攔截 vs 行為精修:重點位置是行為層判準(讀者拿到核心要幾個認知步驟)、比字面層(grep「不是…而是」句型)更本質、且跨語言。grep 抓字面句型、重點位置判讀者的認知成本。

判讀徵兆

徵兆該做的行動
對某寫作問題在「語言 / 句型」層找解(換語言、grep 句型變體)退一步問「本質是不是跨語言的資訊結構問題」、在語言層找不到根本解
「不是 X、而是 Y / 與其 X 不如 Y / 不只 X 更 Y」找核心概念第一次正面出現的位置、後置就前置
reviewer 覺得某句「讀起來優雅 / 自然」就放行警惕高頻偏置 —— 優雅與資訊結構效率是兩件事、用重點位置判準覆核
把寫作問題歸到「不可機械化、只能靠人 / 異源」先確認是不是有可操作的結構判準被跳過(execution)、別太快宣告 design 上限

適用範圍與邊界

  • 適用:對照句 / 定義句的重點位置(不是…而是、與其…不如、不只…更);跨語言寫作;技術 / 教學文(重點優先最該成立的 surface)。
  • 不適用:敘事 / 懸念類寫作(先鋪陳後揭重點是設計、不是缺陷);無單一「重點」的純列舉。
  • 邊界:「重點優先」是可操作判準、但「哪個是重點」仍需理解內容 —— 可操作指「一旦識別重點、位置判定客觀」、不是「全自動無需理解」。對喊話 / 誇飾這類非重點位置的 register、回到 #165 的異源補充。

Self-case:本卡的觸發來源

本卡觸發於 #165 寫完之後、使用者的追問:如果「不是 X、而是 Y」是 LLM 中文訓練出來的行為、換英文或日文思考能不能打破?這個假設的證偽(英 / 日文同樣高頻、英文修辭傳統尤甚)、把問題從「中文句型」釘到「跨語言資訊結構」。使用者並指出真需求是「正面語境描述 + 重點優先陳述」、本質是這個句型表達能力差(重點後置)、不是對抗特定句型。

這校正了 #165 的兩個過度推論:本質可操作(重點位置、跨語言)、不是不可機械化的品味;主解是強制執行重點位置判準、不是異源唯一。記錄這次「把可操作問題誤診成品味上限」的校正 —— 它跟同批 retrospective 第一輪「把問題過度工具化(補 grep)」對稱、兩次都偏離中道(一次過度工具化、一次過度玄學化)、由使用者連續追問拉回(見 memory root-cause-over-toolification)。