动手学习深度学习(17)锚框

茴香豆 Lv5

以每个像素为中心,生成多个缩放比和宽高比(aspect ratio)不同的边界框。 这些边界框被称为锚框(anchor box)。

13.4. 锚框 — 动手学深度学习 2.0.0-beta1 documentation (d2l.ai)

结合上面连接中课本的代码和图片进行理解比较容易理解。

  • 提出多个被称为锚框的区域
  • 预测每个锚框里是否含有关注的物体
  • 如果是,预测从这个锚框到真实边缘框的偏移

IoU-交并比

IoU用来计算两个框之间的相似度,0表示无重叠,1表示重叠。

这是Jacquard指数的一种特殊情况,给定两个集合A和B。
MATHJAX-SSR-10

赋予锚框标号

每个锚框是一个训练样本,将每个锚框,要么标注为背景,要么关联上一个真实边缘框。我们可能会生成大量的锚框(这个导致大量的负类样本)。

使用非极大值抑制(NMS)输出

每个锚框预测一个边缘框,NMS可以合并相似的预测

  • 选择是非背景类的最大预测值
  • 去掉所有其他和他IoU值大于 \theta 的预测
  • 重复上述过程直到所有预测要么被选中,要么被去掉
  • Title: 动手学习深度学习(17)锚框
  • Author: 茴香豆
  • Created at : 2022-11-08 15:00:14
  • Updated at : 2022-11-08 16:57:26
  • Link: https://hxiangdou.github.io/2022/11/08/DL_17/
  • License: This work is licensed under CC BY-NC-SA 4.0.
Comments
On this page
动手学习深度学习(17)锚框