R-CNN

R-CNN·

  • 2014 年
  • 首次使用 CNN 在 2D 目标检测上达到一个不错的效果
  • bottom-up region proposals to localize and segment objects
  • 提供了一个缺少标注数据的问题的训练方法: pre-train the network with supervision for a auxiliary task and fine-tune the network for the target task

Object detection·

  • generate region proposals
    • 可能是各种形状的然后做一个 affine image warping 转换成固定大小
  • use CNN to extract feature vectors
  • a set of class-specific linear SVMs

Region proposals·

用的还是传统 CV 的手法找到分界线用了 selective search

Feature extraction·

从每个 region proposal 提取一个 4096 维的 feature vector by CNN 首先把 region 变换为 227*227 的大小然后 mean-subtract过5个卷积层和2个全连接层

detection·

对于某一个 feature vector 用预训练好的 SVM 去给这个 feature vector 对于每个类算一个 score 通过 non-maximum suppression 决定最终的分类

Training·

在大数据集上预训练 CNN 用 warped region proposals 在之前的基础上继续做 SGD用到了 bounding box labels) N+1 classification layerN 是分类的数量1 for background