YOLO2

#先复习一下yolov1

  • 输出的shape是$7\times7\times30$,分别是类别,置信度和坐标,虽然每个格子输出两个框,但只有一组类别
  • 坐标$x, y$是相对于每一个格的,$w, h$是相对于整个图的,这样做的好处是位置坐标的取值范围都是$[0, 1]$

preview

  • loss都统一认为是回归问题

preview