Page 102 - 无损检测2024年第七期
P. 102

罗 顺,等:
              基于改进 YOLOv8 的针灸用针缺陷检测算法


              尺寸为160×160的特征层p2。然后堆叠卷积和C2f                       式中: μ , σ 为前通道所有神经元的平均数和方差。
                                                                          2
                                                                          t
                                                                       t
              模块提取得到更高纬度的特征层:p3,p4,p5对应大
                                                                     基于统 计平稳性 和通道特 征一致 的前
              小为80×80,40×40,20×20的特征图。继续通过
                                                                提,计算所有神经元的平均值和方差
              SPPF结构进行连续三次最大池化操作,卷积核统一                                                           2
                                                                     1   M     2    1  M
                                                                           x
              为5×5,Padding为2,保证每次池化后特征图大小                        ˋ  =    i   =1 i ,  ˋ  =  i   =1  x i -  ˋ  替换μ ,σ 2
                                                                     M             M                     t   t
              不变,将池化前的输入通过Shortcut与每次池化后
                                                                代入能量函数,得出最小能量公式为
              的结果进行拼接,再使用SimAM注意力机制帮助模
              型聚焦于图像中的重要区域。最后将输出的特征与                                                 4  ˋ  2  +           (6)
                                                                              e * =
              p2特征层拼接并使用C2f进行融合,使得模型能检                                         t  t -u ˋ                    ˋ  2 +2
                                                                                       2
                                                                                        +2
              测4×4及其以上像素大小的缺陷,提升对小缺陷的                                能量 e 越低,神经元t与周围神经元差异越大,
                                                                          *
                                                                          t
              检测能力。                                             对视觉处理更重要,因此每个神经元的重要性可以
              2.2 SimAM注意力机制
                                                                               *
                                                                通过最大化1/ e 来判断。
                                                                              t
                  注意力机制使得神经网络可以更加关注与目标                                                     1
                                                                              ^
              相关的区域      [15] 。常见的注意力机制,将不同位置的                               X =Sigmoid         X        (7)
                                                                                           E
              特征或各个通道进行加权融合,自适应地学习权重
                                                                                                         *
                                                                式中:X为输入的Feature Map;E为对所有 e  在通
              矩阵或权重向量以突出重要的区域或特征。注意力                                                                    t
                                                                道和空间维度上进行分组;在⊙为点积运算,通过激
              机制分为空域注意力与通道注意力,而人脑工作时
                                                                活函数Sigmoid对目标神经元进行增强。
              两种机制往往是协同进行的。
                                                                2.3 MPDIoU
                  SimAM是一种无参数注意力机制,是一种轻量
                                                                     IoU (intersection over union)为目标检测任务
              型且非常有效的注意力模块。SimAM注意力模块将
                                                                中一种评判预测框与标注框重叠程度的指标,常用
              空间注意力与通道注意力相结合,并且没有增加计算
                                                                的IoU有CIoU 、EIoU 。
                                                                              [16]
                                                                                     [17]
              量。在人的视觉系统,当一个明亮目标出现时,受能
                                                                     通常IoU在遇到预测框与标注框具有相同纵横
              量刺激激活的视觉神经元会抑制附近的神经元。这
                                                                比,但宽度和高度值不同的情况时,边界框回归的
              种侧抑制机制有助于提高视觉系统对边缘、轮廓和细
                                                                损失函数几乎没有变化。这导致边界框回归的收敛
              节的感知能力。SimAM同样遵循这一机制,使用能
                                                                速度和准确性降低。为了解决这一问题,在考虑现
              量函数发掘每个神经元的重要性,用式(1) 表示。
                                                                有损失函数中所有相关因素的前提下,并力求简化
                                   M  1              2
                    b
              e ω  t   t , , , y x i  =  1       -1- ω   t x i +b t        计算过程,提出了基于MPDIoU的边界框回归损失
                     t
                              M 
                                 1
                                   i =1                 (1)     函数。
                          
                        +1   t t +b t        2 +λω 2 t             AB         d 2        d  2
                              ω
                          
                                                                            
              式中:t,x 为输入特征X∈R           C*H*W  的单一通道中的             PDIoU = M  AB  -  c 1  w 2  +   1  2  -  c 1  w 2  +h  2  h 2     (8)
                       i
                                                                                                a
                                                                                      a
                                                                                         + y
              目标神经元和其他神经元;i为空间维度上的指数;                                       d 1   1 b -x 1   1 b -y 1 2     (9)
                                                                              = x
                                                                                        2
                                                                             2
              M=H×W为该通道上的神经元数量; ω 和b 为对变                                           b   a  2   b   a  2
                                                     t
                                                 t
                                                                                          + x
              换的加权和偏置; λ 为正则化系数,具有关于ω 和b                    t                2 2  = d   2  - x  2    2  - y  y 2       (10)
                                                        t
              的快速闭合形式解,避免使用优化器而带来的运算。                           式中:上标a,b分别代表标注框和预测框;下标的1,
                                      
                                       t
                                     2-μ                       2分别代表对应框的右上角和左下角;式(8)中的
                          ω t  =-          t            (2)       2  / d  2  + w  h , d  2  /  2  + w  h 表示对对角线的归一化操
                                                                                      2
                                                                          2
                                 t -μ  t  2 +2σ  2 t +2λ        1           2
                                                                作,以便于将对角线距离与IoU进行同尺度比较;c
                                                                                                              1
                             b t  =-  1  t +μ t  w    (3)     用来调整对角线距离的权重,以便更好地衡量位置
                                             t
                                   2                            偏移对IoU的影响。
                                       M  1
                              μ    1     x            (4)     3  试验条件
                                            i
                               t
                                  M 
                                      1
                                        i 1
                                     M -1       2                    试验平台为Ubuntu20. 04,CPU为AMD EPYC
                                         x
                          σ  2 t  =  1     i -  μ  t      (5)
                               M
                                 -1
                                     i =1                       7543,GPU为GeForceRTX 3090。采用CUDA 11. 3
                64
                     2024 年 第 46 卷 第 7 期
                     无损检测
   97   98   99   100   101   102   103   104   105   106   107