原文: https://machinelearningmastery.com/confusion-matrix-machine-learning/
混淆矩阵是用于总结分类算法的表现的技术。
如果每个类中的观察数量不等,或者数据集中有两个以上的类,则单独的分类准确率可能会产生误导。
计算混淆矩阵可以让您更好地了解分类模型的正确性以及它所犯的错误类型。
在这篇文章中,您将发现用于机器学习的混淆矩阵。
阅读这篇文章后你会知道:
- 混淆矩阵是什么以及为什么需要使用它。
- 如何从零开始计算 2 类分类问题的混淆矩阵。
- 如何在 Weka,Python 和 R 中创建混淆矩阵
让我们开始吧。
- 2017 年 10 月更新:修复了工作示例中的一个小错误(感谢 Raktim)。
- 2017 年 12 月更新:修正了准确度计算中的一个小错误(感谢 Robson Pastor Alexandre)
什么是机器学习中的混淆矩阵 摄影: Maximiliano Kolus,保留一些权利
分类准确率是正确预测与总预测的比率。
classification accuracy = correct predictions / total predictions
它通常通过将结果乘以 100 来表示为百分比。
classification accuracy = correct predictions / total predictions * 100
通过反转该值,分类精度也可以很容易地转换为错误分类率或错误率,例如:
error rate = (1 - (correct predictions / total predictions)) * 100
分类准确率是一个很好的起点,但在实践中经常会遇到问题。
分类准确率的主要问题在于它隐藏了您需要的细节,以便更好地理解分类模型的表现。有两个例子,您最有可能遇到此问题:
- 当你的数据有 2 个以上的类。对于 3 个或更多类,您可以获得 80%的分类准确度,但是您不知道是否因为所有类都被预测得同样好,或者模型是否忽略了一个或两个类。
- 当您的数据没有偶数个类时。您可以达到 90%或更高的准确度,但如果每 100 个记录中有 90 个记录属于一个类别,则这不是一个好分数,您可以通过始终预测最常见的类值来达到此分数。
分类准确率可以隐藏诊断模型表现所需的详细信息。但幸运的是,我们可以通过混淆矩阵来区分这些细节。
混淆矩阵是对分类问题的预测结果的总结。
使用计数值汇总正确和不正确预测的数量,并按每个类进行细分。这是混淆矩阵的关键。
混淆矩阵显示了分类模型 在做出预测时的混淆方式。
它不仅可以让您了解分类器所犯的错误,更重要的是可以了解正在进行的错误类型。
正是这种分解克服了仅使用分类精度的限制。
以下是计算混淆矩阵的过程。
- 您需要具有预期结果值的测试数据集或验证数据集。
- 对测试数据集中的每一行做出预测。
- 从预期结果和预测计数:
- 每个班级的正确预测数量。
- 每个类的错误预测数,由预测的类组织。
然后将这些数字组织成表格或矩阵,如下所示:
- 预期在一边:矩阵的每一行对应一个预测的类。
- 在顶部预测:矩阵的每一列对应一个实际的类。
然后将正确和不正确分类的计数填入表中。
类的正确预测总数将进入该类值的预期行和该类值的预测列。
同样,类的错误预测总数将进入该类值的预期行和该类值的预测列。
在实践中,诸如此类的二分类器可以产生两种类型的错误:它可能错误地分配默认为无默认类别的个人,或者它可能错误地将未默认的个人分配给默认类别。通常有兴趣确定正在进行这两种类型的错误中的哪一种。混淆矩阵[...]是显示此信息的便捷方式。
- 第 145 页,统计学习导论:应用于 R ,2014 年
该矩阵可用于易于理解的 2 类问题,但通过向混淆矩阵添加更多行和列,可轻松应用于具有 3 个或更多类值的问题。
让我们通过一个例子来解释创建混淆矩阵。
让我们假设我们有一个两级分类问题,即预测照片是否包含男人或女人。
我们有一个包含 10 个记录的测试数据集,其中包含预期结果和一组来自我们的分类算法的预测。
Expected, Predicted
man, woman
man, man
woman, woman
man, man
woman, man
woman, woman
woman, woman
man, man
man, woman
woman, woman
让我们开始并计算这组预测的分类准确率。
该算法使 10 个预测中的 7 个正确,准确度为 70%。
accuracy = total correct predictions / total predictions made * 100
accuracy = 7 / 10 * 100
但是犯了什么类型的错误?
让我们把结果变成混淆矩阵。
首先,我们必须计算每个类的正确预测数。
men classified as men: 3
women classified as women: 4
现在,我们可以计算每个类的错误预测数量,按预测值组织。
men classified as women: 2
woman classified as men: 1
我们现在可以将这些值安排到 2 级混淆矩阵中:
men women
men 3 1
women 2 4
我们可以从这张桌子上学到很多东西。
- 数据集中的实际总人数是 men 列(3 + 2)上的值的总和
- 数据集中的实际女性总数是女性专栏中的值总和(1 + 4)。
- 正确的值组织在矩阵的左上角到右下角的对角线中(3 + 4)。
- 通过预测男性为女性比预测女性为男性更多的错误。
在一个两类问题中,我们经常寻求从正常观察中区分具有特定结果的观察结果。
如疾病状态或事件,无疾病状态或无事件。
这样,我们可以将事件行分配为“_ 正 ”,将无事件行分配为“ 负 _”。然后我们可以将预测的事件列分配为“true
”,将无事件分配为“false
”。
这给了我们:
- “真阳性”用于正确预测的事件值。
- “误报”表示错误预测的事件值。
- “真阴性”用于正确预测的无事件值。
- “误报”表示错误预测的无事件值。
我们可以在混淆矩阵中总结如下:
event no-event
event true positive false positive
no-event false negative true negative
这有助于计算更高级的分类指标,例如分类器的精确度,召回率,特异性和灵敏度。
例如,分类准确度计算为真阳性+真阴性。
考虑有两个类的情况。 [...]表格的第一行对应于预测为事件的样本。有些是正确预测的(真正的阳性或 TP),而其他的则被错误地分类(假阳性或 FP)。类似地,第二行包含具有真阴性(TN)和假阴性(FN)的预测阴性。
- 第 256 页, Applied Predictive Modeling ,2013
现在我们已经完成了一个简单的 2 级混淆矩阵案例研究,让我们看看如何在现代机器学习工具中计算混淆矩阵。
本节提供了使用顶级机器学习平台的混淆矩阵的一些示例。
这些示例将为您提供有关混淆矩阵的内容的背景信息,以便您在实践中使用实际数据和工具。
在 Explorer 界面中估计模型的技能时,Weka 机器学习工作台将自动显示混淆矩阵。
下面是在 Pima Indians Diabetes 数据集上训练 k-最近邻算法后,来自 Weka Explorer 界面的屏幕截图。
混淆矩数组在底部,您可以看到还提供了大量的分类统计量。
混淆矩阵将字母 a 和 b 分配给类值,并为行提供预期的类值,并为每列提供预测的类值(“分类为”)。
Weka 混淆矩阵和分类统计
您可以在此处了解有关 Weka 机器学习工作台的更多信息。
Python 中用于机器学习的 scikit-learn 库可以计算混淆矩阵。
给定一个预期值的数组或列表以及机器学习模型中的预测列表,confusion_matrix()函数将计算混淆矩阵并将结果作为数组返回。然后,您可以打印此数组并解释结果。
# Example of a confusion matrix in Python
from sklearn.metrics import confusion_matrix
expected = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0]
predicted = [1, 0, 0, 1, 0, 0, 1, 1, 1, 0]
results = confusion_matrix(expected, predicted)
print(results)
运行此示例打印混淆矩阵数组,总结设计的 2 类问题的结果。
[[4 2]
[1 3]]
在 scikit-learn API 文档中了解有关 confusion_matrix()函数的更多信息。
R 中用于机器学习的插入符号库可以计算混淆矩阵。
给定预期值列表和机器学习模型中的预测列表,confusionMatrix()函数将计算混淆矩阵并将结果作为详细报告返回。然后,您可以打印此报告并解释结果。
# example of a confusion matrix in R
library(caret)
expected <- factor(c(1, 1, 0, 1, 0, 0, 1, 0, 0, 0))
predicted <- factor(c(1, 0, 0, 1, 0, 0, 1, 1, 1, 0))
results <- confusionMatrix(data=predicted, reference=expected)
print(results)
运行此示例计算混淆矩阵报告和相关统计量并打印结果。
Confusion Matrix and Statistics
Reference
Prediction 0 1
0 4 1
1 2 3
Accuracy : 0.7
95% CI : (0.3475, 0.9333)
No Information Rate : 0.6
P-Value [Acc > NIR] : 0.3823
Kappa : 0.4
Mcnemar's Test P-Value : 1.0000
Sensitivity : 0.6667
Specificity : 0.7500
Pos Pred Value : 0.8000
Neg Pred Value : 0.6000
Prevalence : 0.6000
Detection Rate : 0.4000
Detection Prevalence : 0.5000
Balanced Accuracy : 0.7083
'Positive' Class : 0
本报告中有大量信息,尤其是混淆矩阵本身。
了解更多关于插入符号 API 文档 [PDF]中 confusionMatrix()函数的信息。
关于混淆矩阵的内容并不多,但本节列出了一些您可能有兴趣阅读的其他资源。
- 维基百科上的混淆矩阵
- 混淆矩阵术语的简单指南
- 混淆矩阵在线计算器
在这篇文章中,您发现了机器学习的混淆矩阵。
具体来说,您了解到:
- 分类准确率的局限性以及何时可以隐藏重要细节。
- 混淆矩阵以及如何从零开始计算并解释结果。
- 如何使用 Weka,Python scikit-learn 和 R 插入库来计算混淆矩阵。
你有什么问题吗? 在下面的评论中提出您的问题,我会尽力回答。