1. SIoU
1.1 原理
有关IoU损失函数,如(GIoU, DIoU, CIoU)没有考虑到真实框与预测框框之间的方向,导致收敛速度较慢,对此SIoU引入真实框和预测框之间的向量角度,重新定义相关损失函数,具体包含四个部分:
(1)角度损失(Angle cost),定义如下
其中为真实框和预测框中心点的高度差,为真实框和预测框中心点的距离,事实上等于角度
为真实框中心坐标为预测框中心坐标,可以注意到当为或0时,角度损失为0,在训练过程中若,则最小化,否则最小化
(2)距离损失(Distance cost),定义如下:
(3)形状损失(Shape cost),定义如下:
其中:
和分别为预测框和真实框的宽和高,控制对形状损失的关注程度,为了避免过于关注形状损失而降低对预测框的移动,作者使用遗传算法计算出接近4,因此作者定于参数范围为[2, 6]
(4)IoU损失(IoU cost)
综上所诉,最终SIoU损失函数定义如下:
1.2 代码实现
有关SIoU得代码实现如下(来源美团yolov6):
elif self.iou_type == 'siou':
# SIoU Loss https://arxiv.org/pdf/2205.12740.pdf
'''
预测框和真实框坐标形式为xyxy,即左下右上角坐标或左上右下角坐标
'''
s_cw = (b2_x1 + b2_x2 - b1_x1 - b1_x2) * 0.5 #真实框和预测框中心点的宽度差
s_ch = (b2_y1 + b2_y2 - b1_y1 - b1_y2) * 0.5 #真实框和预测框中心点的高度差
sigma = torch.pow(s_cw ** 2 + s_ch ** 2, 0.5) #真实框和预测框中心点的距离
sin_alpha_1 = torch.abs(s_cw) / sigma #真实框和预测框中心点的夹角β
sin_alpha_2 = torch.abs(s_ch) / sigma #真实框和预测框中心点的夹角α
threshold = pow(2, 0.5) / 2 #夹角阈值
sin_alpha = torch.where(sin_alpha_1 > threshold, sin_alpha_2, sin_alpha_1) #α大于45°则考虑优化β,否则优化α
angle_cost = torch.cos(torch.arcsin(sin_alpha) * 2 - math.pi / 2) #角度损失
rho_x = (s_cw / cw) ** 2
rho_y = (s_ch / ch) ** 2
gamma = angle_cost - 2
distance_cost = 2 - torch.exp(gamma * rho_x) - torch.exp(gamma * rho_y) #距离损失
omiga_w = torch.abs(w1 - w2) / torch.max(w1, w2)
omiga_h = torch.abs(h1 - h2) / torch.max(h1, h2)
shape_cost = torch.pow(1 - torch.exp(-1 * omiga_w), 4) + torch.pow(1 - torch.exp(-1 * omiga_h), 4) #形状损失
iou = iou - 0.5 * (distance_cost + shape_cost) #siou
loss = 1.0 - iou
文章出处登录后可见!
已经登录?立即刷新