Page 95 - 无损检测2025年第四期
P. 95

王 硕,等:

              基于集成算法的混凝土中钢筋直径涡流检测

                  由表4可以看到,随着C增大,均方误差和平均                         了决策树的复杂度,较小时不能很好地解释模型,但
              绝对误差小幅度减小,决定系数也变化不大,而且                            过大时会使决策树结构过于复杂,在小样本上的预
              考虑到C越大,模型会对训练数据中的噪声和异常                            测出现过拟合,故选择d max =5。
              值越敏感,从而出现过拟合。所以选择C=100较为                              (2)保持d max =5不变,设置n t =30,50,100,随
              合适。                                               机森林模型的预测误差和决定值分别如表8所示。
                 (2)保持C=100和ε=0. 1不变,设置γ=0. 01,                         表8  n t 参数对随机森林模型的影响
              0. 1,1,SVM模型的预测误差和决定系数值如表5                           参数设置         M SE        M AE        R 2
              所示。                                                   n t =30    5.209 85   2.052 68    0.874 57
                            γ
                       表5  γ 参数对SVM模型的影响                            n t =50    5.146 63   2.032 71    0.876 09
                                                                    n t =100   5.678 43   2.156 66    0.863 29
                 参数设置         M SE       M AE         R 2
                 γ=0.01      3.991 37   1.769 23    0.903 91         由表8可以看到,随着决策树数量的增多,均方
                  γ=0.1      1.949 14   1.010 98    0.953 07
                                                                误差和平均绝对误差先减小后增大,在n t =50时,误
                  γ=1        0.832 75   0.682 54    0.979 95
                                                                差和决定系数表现最优,故选择n t =50。
                  由表5可以看到,随着γ 增大,误差减小,决定系                       4.2  集成学习钢筋直径预测模型
              数也逐渐增大,但增大的幅度降低,同时由于较大的                                SVM模型对噪声和异常值具有很好的鲁棒性,
              γ 值会使模型更加关注于训练数据中的局部特征而                           而RF通过构建多棵决策树并进行平均,能够有效地
              可能导致过拟合,故选择γ=0. 1。
                                                                处理高维数据并控制过拟合。Stacking模型结合了
                 (3)保持C=100和γ=0.1不变,设置ε=0.1,0.2,
                                                                RF和SVM的优点,使用SVM作为基学习器来捕捉
              0.5,SVM模型的预测误差和决定系数值如表6所示。
                                                                数据的非线性关系,然后利用RF作为元学习器来学
                            ε
                       表6  ε 参数对SVM模型的影响
                                                                习这些预测结果的组合。利用不同模型的多样性可
                 参数设置         M SE       M AE         R 2
                                                                以提高模型的泛化能力。
                  ε=0.1      0.832 75   0.682 54    0.979 95
                                                                     将SVM模型、随机森林模型、SVM-随机森林
                  ε=0.2      0.812 80   0.705 16    0.980 43
                                                                集成模型应用于钢筋直径预测中,将测试集数据输
                  ε=0.5      0.849 15   0.757 48    0.979 56
                                                                入到3个模型中进行性能评估。3个模型的预测值
                  由表6可以看到ε 在增大的过程中,误差先减小
                                                                与实际值的对比如图7所示。
              后增大,决定系数也先增大后减小。在ε=0. 2时,
                                                                     SVM、随机森林与集成模型的性能指标如表9
              误差最小,决定系数最大,故选择ε=0. 2。
                                                                所示,各模型的性能指标对比如图 8 所示。可以看
              4.1.2  随机森林模型参数设置
                                                                到,相较于单一模型,集成模型的预测效果明显变
                  参数设置时,要考虑随机森林模型中决策树的数
              量n t 和最大深度d max 对预测效果的影响,进行如下分析。                  好,均方误差下降了 63%,平均绝对误差则下降了
                 (1)保持n t =100不变,设置d max =2,5,8,随机              56%,而决定系数提高了9%。
              森林模型的预测误差和决定系数值如表7所示。
                                                                5  结语
                    表7  d max 参数对随机森林模型的影响
                                                                     文章利用钢筋直径涡流动态仿真试验,在不同
                 参数设置         M SE       M AE         R 2
                                                                条件下获取大量检测数据,并将随机森林-支持向量
                 d max =2   20.368 55   3.902 38    0.509 62
                 d max =5    5.678 43   2.156 66    0.863 29    机Stacking集成算法应用到混凝土钢筋直径涡流检
                 d max =8    4.053 74   1.647 03    0.902 41    测中。试验结果表明,集成模型比单一模型的预测
                  由表7可以看到, d max =2时,误差较大,预测效                   效果更好,精度更高,在混凝土钢筋直径检测领域具
              果较差,增加到5时,误差明显降低,拟合效果也较                           有更好的应用前景,对钢筋混凝土涡流检测仪器的
              好,但继续增大时,误差变化不大。由于该参数控制                           研制具有指导意义。







                                                                                                          61
                                                                                         2025 年 第 47 卷 第 4 期
                                                                                                  无损检测
   90   91   92   93   94   95   96   97   98   99   100