动手学习深度学习(17)锚框
以每个像素为中心,生成多个缩放比和宽高比(aspect ratio)不同的边界框。 这些边界框被称为锚框(anchor box)。
13.4. 锚框 — 动手学深度学习 2.0.0-beta1 documentation (d2l.ai)
结合上面连接中课本的代码和图片进行理解比较容易理解。
- 提出多个被称为锚框的区域
- 预测每个锚框里是否含有关注的物体
- 如果是,预测从这个锚框到真实边缘框的偏移
IoU-交并比
IoU用来计算两个框之间的相似度,0表示无重叠,1表示重叠。
这是Jacquard指数的一种特殊情况,给定两个集合A和B。
MATHJAX-SSR-10
赋予锚框标号
每个锚框是一个训练样本,将每个锚框,要么标注为背景,要么关联上一个真实边缘框。我们可能会生成大量的锚框(这个导致大量的负类样本)。
使用非极大值抑制(NMS)输出
每个锚框预测一个边缘框,NMS可以合并相似的预测
- 选择是非背景类的最大预测值
- 去掉所有其他和他IoU值大于 的预测
- 重复上述过程直到所有预测要么被选中,要么被去掉
- Title: 动手学习深度学习(17)锚框
- Author: 茴香豆
- Created at : 2022-11-08 15:00:14
- Updated at : 2022-11-08 16:57:26
- Link: https://hxiangdou.github.io/2022/11/08/DL_17/
- License: This work is licensed under CC BY-NC-SA 4.0.
Comments