只要你做了一個會自動判斷「有沒有」的東西——測試判斷程式碼有沒有壞、掃描判斷有沒有漏洞、分類器判斷是不是垃圾郵件、守衛判斷要不要攔——它就不會永遠對。而且它錯的方式只有兩種。

兩種錯

把判斷(有/無)對上真實(有/無),剛好四格——這張判斷×真實的對照表叫混淆矩陣,false positive 那篇有完整版。

為什麼值得分清楚

因為兩種錯的代價往往不對稱,而且通常此消彼長:壓低一種會抬高另一種。癌症篩檢寧可誤報也不能漏接;自動封鎖寧可漏放也別誤殺。先想清楚「哪種錯更貴」,才知道偵測器該往哪邊偏。

從這裡往下讀