Page 95 - 无损检测2025年第四期
P. 95
王 硕,等:
基于集成算法的混凝土中钢筋直径涡流检测
由表4可以看到,随着C增大,均方误差和平均 了决策树的复杂度,较小时不能很好地解释模型,但
绝对误差小幅度减小,决定系数也变化不大,而且 过大时会使决策树结构过于复杂,在小样本上的预
考虑到C越大,模型会对训练数据中的噪声和异常 测出现过拟合,故选择d max =5。
值越敏感,从而出现过拟合。所以选择C=100较为 (2)保持d max =5不变,设置n t =30,50,100,随
合适。 机森林模型的预测误差和决定值分别如表8所示。
(2)保持C=100和ε=0. 1不变,设置γ=0. 01, 表8 n t 参数对随机森林模型的影响
0. 1,1,SVM模型的预测误差和决定系数值如表5 参数设置 M SE M AE R 2
所示。 n t =30 5.209 85 2.052 68 0.874 57
γ
表5 γ 参数对SVM模型的影响 n t =50 5.146 63 2.032 71 0.876 09
n t =100 5.678 43 2.156 66 0.863 29
参数设置 M SE M AE R 2
γ=0.01 3.991 37 1.769 23 0.903 91 由表8可以看到,随着决策树数量的增多,均方
γ=0.1 1.949 14 1.010 98 0.953 07
误差和平均绝对误差先减小后增大,在n t =50时,误
γ=1 0.832 75 0.682 54 0.979 95
差和决定系数表现最优,故选择n t =50。
由表5可以看到,随着γ 增大,误差减小,决定系 4.2 集成学习钢筋直径预测模型
数也逐渐增大,但增大的幅度降低,同时由于较大的 SVM模型对噪声和异常值具有很好的鲁棒性,
γ 值会使模型更加关注于训练数据中的局部特征而 而RF通过构建多棵决策树并进行平均,能够有效地
可能导致过拟合,故选择γ=0. 1。
处理高维数据并控制过拟合。Stacking模型结合了
(3)保持C=100和γ=0.1不变,设置ε=0.1,0.2,
RF和SVM的优点,使用SVM作为基学习器来捕捉
0.5,SVM模型的预测误差和决定系数值如表6所示。
数据的非线性关系,然后利用RF作为元学习器来学
ε
表6 ε 参数对SVM模型的影响
习这些预测结果的组合。利用不同模型的多样性可
参数设置 M SE M AE R 2
以提高模型的泛化能力。
ε=0.1 0.832 75 0.682 54 0.979 95
将SVM模型、随机森林模型、SVM-随机森林
ε=0.2 0.812 80 0.705 16 0.980 43
集成模型应用于钢筋直径预测中,将测试集数据输
ε=0.5 0.849 15 0.757 48 0.979 56
入到3个模型中进行性能评估。3个模型的预测值
由表6可以看到ε 在增大的过程中,误差先减小
与实际值的对比如图7所示。
后增大,决定系数也先增大后减小。在ε=0. 2时,
SVM、随机森林与集成模型的性能指标如表9
误差最小,决定系数最大,故选择ε=0. 2。
所示,各模型的性能指标对比如图 8 所示。可以看
4.1.2 随机森林模型参数设置
到,相较于单一模型,集成模型的预测效果明显变
参数设置时,要考虑随机森林模型中决策树的数
量n t 和最大深度d max 对预测效果的影响,进行如下分析。 好,均方误差下降了 63%,平均绝对误差则下降了
(1)保持n t =100不变,设置d max =2,5,8,随机 56%,而决定系数提高了9%。
森林模型的预测误差和决定系数值如表7所示。
5 结语
表7 d max 参数对随机森林模型的影响
文章利用钢筋直径涡流动态仿真试验,在不同
参数设置 M SE M AE R 2
条件下获取大量检测数据,并将随机森林-支持向量
d max =2 20.368 55 3.902 38 0.509 62
d max =5 5.678 43 2.156 66 0.863 29 机Stacking集成算法应用到混凝土钢筋直径涡流检
d max =8 4.053 74 1.647 03 0.902 41 测中。试验结果表明,集成模型比单一模型的预测
由表7可以看到, d max =2时,误差较大,预测效 效果更好,精度更高,在混凝土钢筋直径检测领域具
果较差,增加到5时,误差明显降低,拟合效果也较 有更好的应用前景,对钢筋混凝土涡流检测仪器的
好,但继续增大时,误差变化不大。由于该参数控制 研制具有指导意义。
61
2025 年 第 47 卷 第 4 期
无损检测

