YOLO2 发表于 2019-10-20 更新于 2026-01-02 #先复习一下yolov1输出的shape是$7\times7\times30$,分别是类别,置信度和坐标,虽然每个格子输出两个框,但只有一组类别坐标$x, y$是相对于每一个格的,$w, h$是相对于整个图的,这样做的好处是位置坐标的取值范围都是$[0, 1]$loss都统一认为是回归问题