- 在 Fast R-CNN 降低了卷积的时间时候
region proposal 成为了效率的瓶颈, - 引入了一个 region proposal 的网络 RPN
region proposal network( ) 这是一个全卷积网络, FCN( ) 可以在每个位置预测目标边界和目标分数, - 生成区域后用 Fast R-CNN 继续做
- 将 RPN 和 Fast R-CNN 合并成一个新的网络
introduction·
卷积特征映射也可以用来生成 region proposal
在特征的基础上添加额外的卷积层来构建 RPN
为了将两个网络融合
Region Proposal Networks·
输入任意大小的图像

- slide a small network over the feature map
- input spatial window of the feature map
- output 低维向量
- 就是一个 的卷积层
- 分支出去两个
一个 box-regression layer (reg) 和一个 box-classification layer (cls), 刚才得到的低维向量分别进到两个部分中, - 之前说了是 FCN
所以两个分支其实是两个 的卷积层,
Anchor·
在每个 sliding window 上
我们使用一个 sliding window 在 feature map 上滑动
we use scales with box areas of , , and pixels, and aspect ratios of and
这样就会有 一共 种 anchor
基于候选框的 cls 的得分
Loss·


权值共享·
论文提出一种算法通过交替优化来实现权值共享
- 利用ImageNet预训练分类模型初始化前置卷积网络层参数
并开始单独训练RPN网络参数, ; - 固定RPN网络独有的卷积层以及全连接层参数
再利用 ImageNet预训练分类模型初始化前置卷积网络参数, 并利用RPN 网络生成的候选框去训练Fast RCNN网络参数, 。 - 固定利用Fast RCNN训练好的前置卷积网络层参数
去微调RPN 网络独有的卷积层以及全连接层参数, 。 - 同样保持固定前置卷积网络层参数
去微调Fast RCNN网络的全连接层参数, 最后RPN网络与Fast RCNN网络共享前置卷积网络层参数。 构成一个统一网络, 对Fast R-CNN的全连接层进行微调。 。