Page 102 - 无损检测2024年第七期

P. 102

罗顺，等：
基于改进 YOLOv8 的针灸用针缺陷检测算法

尺寸为160×160的特征层p2。然后堆叠卷积和C2f 式中： μ ， σ 为前通道所有神经元的平均数和方差。
2
t
t
模块提取得到更高纬度的特征层：p3，p4，p5对应大
基于统计平稳性和通道特征一致的前
小为80×80，40×40，20×20的特征图。继续通过
提，计算所有神经元的平均值和方差
SPPF结构进行连续三次最大池化操作，卷积核统一 2
1 M 2 1 M
x
为5×5，Padding为2，保证每次池化后特征图大小 ˋ = i  =1 i , ˋ = i  =1 x i - ˋ 替换μ ，σ 2
M M t t
不变，将池化前的输入通过Shortcut与每次池化后
代入能量函数，得出最小能量公式为
的结果进行拼接，再使用SimAM注意力机制帮助模
型聚焦于图像中的重要区域。最后将输出的特征与 4 ˋ 2 + （6）
e * =
p2特征层拼接并使用C2f进行融合，使得模型能检 t t -u ˋ ˋ 2 +2
2
+2
测4×4及其以上像素大小的缺陷，提升对小缺陷的能量 e 越低，神经元t与周围神经元差异越大，
*
t
检测能力。对视觉处理更重要，因此每个神经元的重要性可以
2.2 SimAM注意力机制
*
通过最大化1/ e 来判断。
t
注意力机制使得神经网络可以更加关注与目标 1
^
相关的区域 [15] 。常见的注意力机制，将不同位置的 X =Sigmoid  X （7）
E
特征或各个通道进行加权融合，自适应地学习权重
*
式中：X为输入的Feature Map；E为对所有 e 在通
矩阵或权重向量以突出重要的区域或特征。注意力 t
道和空间维度上进行分组；在⊙为点积运算，通过激
机制分为空域注意力与通道注意力，而人脑工作时
活函数Sigmoid对目标神经元进行增强。
两种机制往往是协同进行的。
2.3 MPDIoU
SimAM是一种无参数注意力机制，是一种轻量
IoU （intersection over union）为目标检测任务
型且非常有效的注意力模块。SimAM注意力模块将
中一种评判预测框与标注框重叠程度的指标，常用
空间注意力与通道注意力相结合，并且没有增加计算
的IoU有CIoU 、EIoU 。
[16]
[17]
量。在人的视觉系统，当一个明亮目标出现时，受能
通常IoU在遇到预测框与标注框具有相同纵横
量刺激激活的视觉神经元会抑制附近的神经元。这
比，但宽度和高度值不同的情况时，边界框回归的
种侧抑制机制有助于提高视觉系统对边缘、轮廓和细
损失函数几乎没有变化。这导致边界框回归的收敛
节的感知能力。SimAM同样遵循这一机制，使用能
速度和准确性降低。为了解决这一问题，在考虑现
量函数发掘每个神经元的重要性，用式（1）表示。
有损失函数中所有相关因素的前提下，并力求简化
M  1 2
b
e ω t  t , , , y x i  = 1    -1- ω  t x i +b t     计算过程，提出了基于MPDIoU的边界框回归损失
t
M 
1
i =1 （1）函数。

+1  t t +b t     2 +λω 2 t AB d 2 d 2
ω


式中：t，x 为输入特征X∈R C*H*W 的单一通道中的 PDIoU = M AB - c 1 w 2 +  1 2 - c 1 w 2 +h 2 h 2 （8）
i
a
a
+ y
目标神经元和其他神经元；i为空间维度上的指数； d 1  1 b -x 1  1 b -y 1 2 （9）
= x
2
2
M=H×W为该通道上的神经元数量； ω 和b 为对变 b a 2 b a 2
t
t
+ x
换的加权和偏置； λ 为正则化系数，具有关于ω 和b t 2 2 = d  2 - x 2   2 - y y 2  （10）
t
的快速闭合形式解，避免使用优化器而带来的运算。式中：上标a，b分别代表标注框和预测框；下标的1，

t
2-μ  2分别代表对应框的右上角和左下角；式（8）中的
ω t =- t （2） 2 / d 2 + w h ， d 2 / 2 + w h 表示对对角线的归一化操
2
2
 t -μ t  2 +2σ 2 t +2λ 1 2
作，以便于将对角线距离与IoU进行同尺度比较；c
1
b t =- 1  t +μ t  w （3）用来调整对角线距离的权重，以便更好地衡量位置
t
2 偏移对IoU的影响。
M  1
μ  1  x （4） 3 试验条件
i
t
M 
1
i 1
M -1 2 试验平台为Ubuntu20. 04，CPU为AMD EPYC
x
σ 2 t = 1   i - μ t  （5）
M
-1
i =1 7543，GPU为GeForceRTX 3090。采用CUDA 11. 3
64
2024 年第 46 卷第 7 期
无损检测

97 98 99 100 101 102 103 104 105 106 107