Page 103 - 无损检测2024年第七期
P. 103

罗 顺,等:
              基于改进 YOLOv8 的针灸用针缺陷检测算法


              进行并行加速,基于Python3. 8 的PyTorch 1. 11. 0             测任务中常用的评估指标,综合考虑模型在不同类
              深度学习框架进行实现。文章的数据集来自生产现                            别上的准确性和召回能力,采用每秒帧数来评估模
              场,为通过 500 W 工业相机获取的 1 632  张一次                    型的速度。
              性针灸用针的缺陷图片,其中钝头、毛刺、弯尖、
                                                                4  试验过程与分析
              异物的数量分别为 450,380,421,382  张,按照
              8∶2 的比例划分为训练集和验证集。无预训练权                           4.1  消融试验
              重进行训练,epoch 为 300,batch size 为 8,图像大                   文章模型由YOLOv8s改进所得,为了验证各改
              小为 640×640,使用 Adam 优化器,初始学习率为
                                                                进策略的有效性进行消融试验。
              0. 001,动量为 0. 937。在训练过程中使用实时数                     4.1.1  Neck结构有效性验证
              据增强方法对训练集中的图片进行在线增强,通
                                                                     为验证针对微小缺陷检测改进的有效性,将v8s
              过缩放、左右翻转、上下翻转提升模型的鲁棒性。
                                                                与添加小目标特征层的模型,在同一试验环境下进
                  数据集展示如图3所示。IoU为预测框和标注框
                                                                行试验,结果如表2所示。
              的交集与并集的比值,如式(8) 所示,用于评价预测
                                                                            表2 Neck结构验证试验
              框的精准程度以判定预测是否正确。IoU越接近1说
                                                                                 各类缺陷平均精度/%
              明预测框与真实框重合程度越高,检测的质量越优。                                方法                               m AP @0.5
                                                                              钝头    毛刺    弯尖    异物
                                                                   YOLOv8s    93.4  86.4  93.4  92.4   0.914
                                                                  YOLOv8s-p2  94.3  92.9  94.2  93.0   0.936
                                                                     通过表 2 的检测结果可知,添加 p2 特征层输
                                                                出后,模型的平均检测精度提升了 2%,在 IoU 阈
                                                                值为 0. 5 到 0. 95 范围内的精度和召回率之间的
                                                                平衡更好。各类缺陷的精度均有所提升,钝头、
                              图 3  数据集展示
                                                                弯尖、异物各自提高了 0. 9%,0. 8%,0. 6%。其
                  对于分类任务,根据目标的实际类别和预测类
                                                                中微小缺陷较多的毛刺类缺陷,添加小目标检测
              别的情况,将样本划分为T 、T 、F 、F 四种。评价
                                      P  N   P  N               层后,在原模型的基础上提升了 6. 5%。这表明
              指标包括精密度(Precision)、召回率(Recall)、平均
                                                                Neck 结构的改进,能有效提高微小缺陷的检测
              精密度(Mean average precision)。混淆矩阵如表 1
                                                                精度。
              所示。
                                                                4.1.2  注意力机制有效性验证
                              表1  混淆矩阵
                                                                     在YOLOv8S基础上,在Backbone与Neck之间
                                        预测                                   [18]  [19]   [20]
                 实际                                             分别添加LSK 、SE 、EMA 、SimAM注意力机制,
                                正                 负
                                                                在同一试验环境下进行验证试验,结果如表3所示。
                 正样本      T P :正样本,预测为正     T N :负样本,预测为正
                 负样本      F P :正样本,预测为负     F N :负样本,预测为负          表3  不同注意力机制的有效性验证试验结果

                                     T                              方法       P/%      R/%     m AP @0.5  浮点运算
                                                                                                        次数
                               P =     P               (11)
                                   T P +F P                       YOLOv8s    90.7     89.4     0.914    28.7 G
                                     T                             +LSK      90.5     91.8     0.928    29.0 G
                               R =     P               (12)         +SE      91.0     92.1     0.931    28.7 G
                                   T P +F N                        +EMA      91.2     92.0     0.932    28.9 G
                                        
                              A P  1 Pr   dr          (13)       +SimAM     91.3     92.3     0.937    28.7 G
                                 =
                                    0
                                                                     由表3可以看出,SimAM注意力机制提高了检
                             m   =  1  i  k  A        (14)
                              AP   k    =1  Pi                  测精度,同时并没有增加多余的计算量。这表明与
              式中:P为模型在测试集上的分类正确率;R为召回                           LSK、SE、EMA注意力机制相比较,在YOLOv8s模
              率,其值越高,表示模型能够识别更多的真实正例,                           型中添加SimAM注意力机制能够更好地增强模型
              模型的覆盖率越高; m AP (平均精度均值)为目标检                       对图像重要区域的关注和理解能力。
                                                                                                          65
                                                                                         2024 年 第 46 卷 第 7 期
                                                                                                  无损检测
   98   99   100   101   102   103   104   105   106   107   108