深度学习模型训练好了,但是我们怎么知道我们的模型效能是不是符合我们的预期呢?
于是便有了深度学习模型的评估指标
準確率(accuracy)
模型對所有照片判断是否正确,即良品與不良品可準確區分的概率。
混淆矩陣(confusion matrix)
混淆矩陣是機器學習中總結分類模型預測結果的情形分析表,以矩陣形式將數據集中的記錄按照真實的類別與分類模型預測的類別判斷兩個標準進行匯總。混淆矩陣有几个名词如下:
TP: True Positive(真实为异常,实际为异常)
FN: False Negative (真实为异常,实际为正常)
FP: False Positive(真实为正常,实际为异常)
TN: True Negative(真实为正常,实际为正常)
精確率Precision = TP/(TP+FP),为對預測結果評判,即預測為不良品中实际不良的概率,了解模型推論結果是否有误判產生。
召回率Recall = TP/(TP+FN),模型對不良品判定概率,即不良品是否可以全部被認出概率,了解模型推論結果是否有漏判產生。
precision/recall的綜合指標F1-score=2*Precision*Recall/(Precision+Recall),介於0~1之間, 越接近1代表各類別預測能力越好。
IoU 交并比(Intersection over Union)
通过这个名称我们大概可以猜到 IoU 的计算方法。IoU 计算的是 “预测的边框” 和 “真实的边框” 的交集和并集的比值。
mAP(均值平均精度)
mAP可以分成m+AP,m表示平均的意思,AP值我们可以理解成前面的Precision和Recall所绘制曲线围成的面积,如果有m个对象,那么就把每个对象的Precision和Recall曲线的面积计算出来,然后取平均值。
如何选择我们的指标?
我有整理出一个对照表来供大家参考:
PS:如果没有列出小伙伴使用的模型,可以评论询问,大家一起找答案