- 主要解决了在目标检测中
检测框不是特别准, 容易出现噪声干扰的问题, - Cascade R-CNN就是使用不同的IOU阈值
训练了多个级联的检测器, 。
检测框不准
mismatch 问题·
- 在training阶段
由于我们知道 ground truth, 所以可以很自然的把iou大于threshold, 0.5( 的Proposals作为正样本) 这些正样本参与之后的bbox回归学习, 。 - 在inference阶段
由于我们不知道ground truth, 所以只能把所有的proposal都当做正样本, 让后面的bbox回归器回归坐标, 。
我们可以明显的看到training阶段和inference阶段
提高了 IoU 阈值
实验·

©图中横轴表示RPN的输出proposal的IoU
- 只有proposal自身的阈值和训练器训练用的阈值较为接近的时候
训练器的性能才最好, 。
单一阈值不能对所有的 proposal 都有很好的效果
所以考虑多阈值的 multi-stage 的结构
