动手学习深度学习(18)物体检测算法:R-CNN,SSD,YOLO
快速讲解一下目标检测的常用算法。
R-CNN
- 使用启发式搜索算法来选择锚框
- 使用预训练模型来对每个锚框抽取特征
- 训练一个SVM来对类别分类
- 训练一个线性回归模型来预测边缘框偏移
兴趣区域(RoI)池化层
- 给定一个锚框,均匀分割成n x m块,输出每块里的最大值
- 不管锚框多大,总是输出nm个值
Fast RCNN
- 使用CNN对图片抽取特征
- 使用RoI池化层对每个锚框生成固定长度特征
Faster RCNN
- 使用一个区域提议网络来替代启发式搜索来获得更好的锚框
Mask RCNN
- 如果有像素级别的标号,使用FCN来利用这些信息
单次多框检测(SSD)
- 一个基础网络来抽取特征,然后多个卷积层块来减半高宽
- 在每段都生成锚框。底部段来拟合小物体,顶部段来拟合大物体
- 对每个锚框预测类别和边缘框
YOLO
- SSD中锚框大量重叠,因此浪费了很多计算
- YOLO将图片均匀分成S x S个锚框
- 每个锚框预测B个边缘框
- 后续版本(V2,V3,V4。。。)持续更新
- Title: 动手学习深度学习(18)物体检测算法:R-CNN,SSD,YOLO
- Author: 茴香豆
- Created at : 2022-11-08 16:58:44
- Updated at : 2022-11-08 17:34:10
- Link: https://hxiangdou.github.io/2022/11/08/DL_18/
- License: This work is licensed under CC BY-NC-SA 4.0.
Comments