你的自動判斷會犯兩種錯:誤報與漏接
你的自動判斷會犯兩種錯:誤報與漏接
只要你做了一個會自動判斷「有沒有」的東西——測試判斷程式碼有沒有壞、掃描判斷有沒有漏洞、分類器判斷是不是垃圾郵件、守衛判斷要不要攔——它就不會永遠對。而且它錯的方式只有兩種。
兩種錯
- 說「有」但其實沒有 → 誤報(false positive)。
- 說「沒有」但其實有 → 漏接(false negative)。
把判斷(有/無)對上真實(有/無),剛好四格——這張判斷×真實的對照表叫混淆矩陣,false positive 那篇有完整版。
為什麼值得分清楚
因為兩種錯的代價往往不對稱,而且通常此消彼長:壓低一種會抬高另一種。癌症篩檢寧可誤報也不能漏接;自動封鎖寧可漏放也別誤殺。先想清楚「哪種錯更貴」,才知道偵測器該往哪邊偏。
從這裡往下讀
- 想徹底搞懂這兩種錯:false positive、false negative。
- 統計課對這兩種錯的編號:Type I error(= 誤報)、Type II error(= 漏接)。
- 想用數字衡量這兩種錯有多少:見怎麼量一個偵測器準不準。