One - One Code All

Blog Content

二元分类混淆矩阵

机器学习 数据挖掘 推荐系统   2012-06-02 08:13:19

混淆矩阵是用来总结一个分类器结果的矩阵。

对于k元分类,其实它就是一个k x k的表格,用来记录分类器的预测结果。


分类结果表述:

TP = True Postive = 真阳性; FP = False Positive = 假阳性

FN = False Negative = 假阴性; TN = True Negative = 真阴性


先用表格做一个矩阵示例,如下:


预测值1
预测值0
真实值1
6  (TP)
4 (FN)
真实值0
5  (FP)
3 (TN)


混淆矩阵中的这四个数值,经常被用来定义其他一些度量。


准确度(Accuracy) = (TP+TN) / (TP+TN+FN+TN)

在上面的例子中,准确度 = (6+3) / 16 = 0.563


精度(precision, 或者PPV, positive predictive value) = TP / (TP + FP)

在上面的例子中,精度 = 6 / (6+5) = 0.545


召回(recall, 或者敏感度,sensitivity,真阳性率,TPR,True Positive Rate) = TP / (TP + FN)

在上面的例子中,召回 = 6/ (6+4) = 0.6


特异度(specificity,或者真阴性率,TNR,True Negative Rate) = TN / (TN + FP)

在上面的例子中,特异度 = 3 / (3+5) = 0.375


F1-值(F1-score) = 2*TP / (2*TP+FP+FN) 

在上面的例子中,F1-值 = 2*6 / (2*6+4+5) = 0.631




上一篇:准确率与召回率
下一篇:TFIDF算法介绍

The minute you think of giving up, think of the reason why you held on so long.