动手学习深度学习(18)物体检测算法:R-CNN,SSD,YOLO

茴香豆 Lv5

快速讲解一下目标检测的常用算法。

R-CNN

  • 使用启发式搜索算法来选择锚框
  • 使用预训练模型来对每个锚框抽取特征
  • 训练一个SVM来对类别分类
  • 训练一个线性回归模型来预测边缘框偏移

兴趣区域(RoI)池化层

  • 给定一个锚框,均匀分割成n x m块,输出每块里的最大值
  • 不管锚框多大,总是输出nm个值

Fast RCNN

  • 使用CNN对图片抽取特征
  • 使用RoI池化层对每个锚框生成固定长度特征

Faster RCNN

  • 使用一个区域提议网络来替代启发式搜索来获得更好的锚框

Mask RCNN

  • 如果有像素级别的标号,使用FCN来利用这些信息

单次多框检测(SSD)

  • 一个基础网络来抽取特征,然后多个卷积层块来减半高宽
  • 在每段都生成锚框。底部段来拟合小物体,顶部段来拟合大物体
  • 对每个锚框预测类别和边缘框

YOLO

  • SSD中锚框大量重叠,因此浪费了很多计算
  • YOLO将图片均匀分成S x S个锚框
  • 每个锚框预测B个边缘框
  • 后续版本(V2,V3,V4。。。)持续更新
  • Title: 动手学习深度学习(18)物体检测算法:R-CNN,SSD,YOLO
  • Author: 茴香豆
  • Created at : 2022-11-08 16:58:44
  • Updated at : 2022-11-08 17:34:10
  • Link: https://hxiangdou.github.io/2022/11/08/DL_18/
  • License: This work is licensed under CC BY-NC-SA 4.0.
Comments
On this page
动手学习深度学习(18)物体检测算法:R-CNN,SSD,YOLO