机器学习算法评估指标——2D 目标检测

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 1691 天前的主题，其中的信息可能已经有所发展或是发生改变。

目标检测是计算机视觉领域的传统任务，需要识别出图像上存在的物体，给出对应的类别，并将该物体的位置通过最小包围框（ Bounding box ）的方式给出。下面介绍 2D 目标检测任务的常用评价指标。 IoU （ Intersection over Union ）

定义：交并比，两个矩形框交集的面积与并集的面积之比范围：0~100% 用途：判断两个矩形框的重叠程度，值越高则重叠程度越高，即两个框越靠近 IoU 和 Overlap Rate 定义是完全相同的，只不过在检测任务中常写作 IoU，在跟踪任务中常写作 Overlap Rate 附：3D 目标检测中的 IoU

IoU threshold 定义：需要人为设定的 IoU 的阈值，高于该阈值的矩形框被认为是命中目标，反之则被认为未命中范围：0~100% 用途：作为区分矩形框是否命中目标的指标，阈值越高则要求矩形框与真值重叠程度越高附：3D 目标检测中的 IoU threshold

TP，TN，FP，FN 正样本负样本判断为正 TP FP 判断为负 FN TN TP （ True Positive，真阳性）：检测器给出正样本，事实上也是正样本，即正确检测到目标 TN （ True Negative，真阴性）：检测器给出负样本，事实上也是负样本，即正确检测到非目标 FP （ False Positive，假阳性）：检测器给出正样本，事实上却是负样本，即误检测 FN （ False Negative，假阴性）：检测器给出负样本，事实上却是正样本，即漏检测附：3D 目标检测中的 TP，T N，FP，FN

Precision 定义：精确度（查准率），表示检测器给出所有正样本中正确的百分比计算：Precision = 检测器正确检测的正样本个数 /检测器给出的所有正样本个数 = TP/(TP + FP) 范围：0~100% 用途：用于评估检测器在检测成功基础上的正确率附：3D 目标检测中的 Precision

Recall 定义：召回率（查全率），表示真值给出的所有正样本中被检测器检测到的百分比计算：Recall = 检测器正确检测的正样本个数 /真值给出的所有正样本个数 = TP/(TP + FN) 范围：0~100% 用途：用于评估检测器对所有待检测目标的检测覆盖率附：3D 目标检测中的 Recall

PR 曲线

定义：Precision-Recall 曲线，即以 Precision 为纵坐标、Recall 为横坐标所作的曲线绘制：选取不同的 confidence 阈值，可以在 PR 坐标系上得到不同的点，连接这些点即可获得 PR 曲线用途：用来评估模型性能。Precision 值和 Recall 值越大越好，所以 PR 曲线越往右上角凸越好。附：3D 目标检测中的 PR 曲线

AP （ Average Precision ）定义：平均精度，即 PR 曲线下的面积范围：0~100% 用途：用来衡量算法在单个类别上的平均精度。AP 值越高，表示对这个类别的检测精度越高。计算：11 点插值法和所有点插值法 11 点插值法：VOC2010 以前，选取当 Recall >= 0, 0.1, 0.2, ..., 1 共 11 个点时的 Precision 最大值，AP 是这 11 个 Precision 的平均值，此时只由 11 个点去近似 PR 曲线下面积。

所有点插入法：从 2010 年开始，PASCAL VOC 计算 AP 的方法发生了变化，使用所有点插入法而不是 11 个等间隔点插入了。

在这种情况下，不再使用仅在几个点上观察到的 precision，而是通过对每个 precision 进行插值来获得 AP 。这样，我们可以估计曲线下的面积。附：3D 目标检测中的 AP

mAP （ Mean Average Precision ）定义：平均精度均值，即多个类别的 AP 的平均值范围：0~100% 用途：用来衡量算法在所有类别上的整体精度表现。mAP 值是目标检测算法最重要的评估指标之一。附：3D 目标检测中的 mAP

f-measure 定义：Precision 和 Recall 的加权调和平均值计算： fβ-measure = ( β^2 + 1 ) * P * R / ( β^2 * P + R ) 当 β = 1 时，即为 f1-measure： f1-measure = 2 * P * R / ( P + R ) 范围：0~100% 用途：Precision 和 Recall 在一般情况下是互斥的，即 Precision 越高，Recall 越低。f-measure 用于为两者给出一个综合评判。附：3D 目标检测中的 f-measure

FPPI （ False Positive Per Image ）定义：每张图片的误检数，相比 precision 和 recall 更加直观用途：评估平均误检数

目前尚无回复

检测 precision recall 样本