数据挖掘 – 分类的模型评估度量


混淆矩阵 CM(Confusion Matrix)

actual/precideYesNo合计
YesTPFNP
NoFPTNN
合计P^N^P+N 或者 P^ + N^
术语含义例子
TP(True Postive) :正确 分类的 正元组buy_computer = yes 的元组,被分类器预测为 buy_computer = yes
TN(True Negative) :正确 分类的 负元组buy_computer = no 的元组,被分类器预测为 buy_computer = no
FP(False Postive) :错误 标记为 正元组 的负元组buy_computer = no 的元组,被分类器预测为 buy_computer = yes
FN(False Negative) :错误 标记为 负元组 的正元组buy_computer = yes 的元组,被分类器预测为 buy_computer = no

度量

度量公式含义
准确率、识别率(accuracy) T P + T N P + N \frac{TP+TN}{P+N} P+NTP+TN正确分类元组 的占比
错误率、误分类率 (error rate / 1-accuracy) F P + F N P + N \frac{FP+FN}{P+N} P+NFP+FN错误分类元组 的占比
敏感度、真正例率、召回率( recall / sensitivity) T P P \frac{TP}{P} PTP正确识别的正元组 的占比
特效性、真负例率( specificity) T N N \frac{TN}{N} NTN正确识别的负元组 的占比
精度 (precision) T P T P + F P \frac{TP}{TP+FP} TP+FPTP标记为正类的元组实际为正类所占 的百分比
F、F1、F分数 2 ∗ p r e c i s i o n ∗ r e c a l l p r e c i s i o n + r e c a l l \frac{2 * precision * recall}{precision+ recall} precision+recall2precisionrecall精度和召回率的调和均值(另一种使用precision和recall的方法)
F β F_β Fβ : β是非负实数 ( 1 + β 2 ) ∗ p r e c i s i o n + r e c a l l β 2 ∗ p r e c i s i o n + r e c a l l \frac{(1+β^2) *precision+ recall}{β^2*precision+ recall} β2precision+recall(1+β2)precision+recall也是 另一种使用precision和recall的方法

ROC

含义公式
Y轴(TPR)sensitivity / recall T P P \frac{TP}{P} PTP
X轴(FPR)1-specificity F P N \frac{FP}{N} NFP

相关文章:
https://jingyan.baidu.com/article/63acb44acf685161fcc17ec9.html
https://www.plob.org/article/12476.html

相关图像

ROC

在这里插入图片描述

推荐内容
点击阅读全文
Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐