网站建设投标书服务方案范本,做推广的技巧,南京网站优化平台,建网站的服务器1.ROI pooling 和 ROI align的区别 ROI pooling第一步根据候选区域找特征图的位置#xff0c;可能不是刚好对应#xff0c;需要一次量化#xff0c;如上图所示#xff0c;第二次是特征图需要转化为特定的大小#xff0c;这时候pooling可能也不能正好整除#xff0c;所以第…1.ROI pooling 和 ROI align的区别 ROI pooling第一步根据候选区域找特征图的位置可能不是刚好对应需要一次量化如上图所示第二次是特征图需要转化为特定的大小这时候pooling可能也不能正好整除所以第二次量化这两次量化在像素级的任务上会有很大的误差。而align则不会量化是直接取小数部分最后每个格子分四块求一个maxpooling这四块区域的特征是通过双线性插值得到的。这样就没有量化导致的较大的损失。
2.YOLO3-YOLO5模型结构与正负样本分配策略 yolov3的网络结构DarkNet53和FPN的结构多尺度预测三个不同分辨率的特征图。 yolov5的输入端mosaic数据增强将四张图片随即缩放裁剪排布放在一起。
自适应锚框计算根据不同数据集自适应的得到锚框的大小。
自适应图片缩放不同分辨率的图片会变为同样的进行黑边填充
模型端 首先是FOCUS切片操作降低计算量。
CSPNet结构降低计算量丰富梯度传播将特征channel分为两份不同的传播下去。
FPNPAN的neck结构相当于又将特征图传播上去了。
使用的CIOU-lossGIOU-loss加上最大外接矩形DIOU-loss加入中心点距离CIOU-loss加入长宽比。
正负样本分配策略
yolov3的话是一个GT只有一个正样本只在一个分辨率特征图上的一个网格里选择一个anchor为正。剩下的IOU小于阈值为负。
yolov4里面把GT先分到一个分辨率特征图里每一个特征图分别进行正负样本计算只要IOU大于阈值就为正样本。
yolov5里面一个GT分给三个特征图GT落在一个网格里再找相近的两个网格一个GT跟27个anchor匹配只要宽高比小于阈值就为正。
3.yolov6-yolov7和yolox
4.sort和deepsort跟踪算法