Page 102 - 无损检测2024年第十一期
P. 102

王煜鑫,等:
              基于声发射和 XGBoost 的陶瓷基复合材料剩余强度预测


              响,但处理非线性关系时效果不佳。                                  2.2.3  陶瓷基复合材料剩余强度预测模型
                 (2)模型评价准则                                           通过陶瓷基复合材料C/SiC的加载试验,文章
                  用于衡量模型有效性和进行比较的性能指标是                          收集了有效的声发射信号,然后,对用于预测的声
              平均绝对误差(Mean Absolute Error,MAE),平均                发射信号数据集进行了设计,形成了包含计数、绝
              相对误差(Mean Relative Error,MRE)和均方误差                对能量、持续时间、峰值频率、累积绝对能量、预警
             (Mean Square Error,MSE)。                           函数值及对应材料剩余强度的数据集合。材料剩
                  平均绝对误差由式(3)定义为                                余强度为数据标签,是预测模型的预测目标,其他
                                                                数据列为数据特征列。文章共收集了 75 131 个数
                                                        (3)
                                                                据点,其中70 581条声发射数据作为模型的训练及
                  平均相对误差由式(4)定义为                                测试集,训练、测试集的比例为 8∶2;其余 4 550 条
                                     -y
                                 n
                                     i
                         M   =  1 ∑  y �  i  ×  100%    (4)     数据作为新试件的声发射数据,验证模型的泛化
                                                                性能。
                           RE  n  i= 1  y
                                       i
                                                                     采用不包括预警函数值的数据集合进行模型
                  均方误差由式(5)定义为
                                                                训练,对比基于不同机器学习算法构建的剩余强
                                                                度模型性能,结果如表 1 所示。由表 1 可以看出,
                                                        (5)
                                                                基于 XGBoost 的模型在 3 个数据集上的模型性能
              式中:y 为实际值; 为预测值;y 为实际数值的平                         指标均优于其他 3 种算法,其在测试集和新试件测
                     i
                                             i
              均值;n为样本总数。                                        试集上的预测结果如图 5 所示(特征不包括预警函
                 (3)基于夏普系数的模型可解释性分析                             数)。由表 1 和图 5 可以看出,在两个测试集上模
                  夏普系数(Shapley Additive Explanation,SHAP)       型预测结果的平均绝对误差分别为 2. 25 MPa 和
              的目标是通过计算每个特征对预测的贡献来解释实                            7. 75 MPa。
              例的预测。SHAP解释方法根据博弈论计算夏普值                                为提升基于XGBoost的剩余强度预测模型性
             (Shapley Value) ,被表示为一种加性特征归因方                     能,在数据特征中加入预警函数值,其测试结果如
                             [16]
              法,其核心是计算特征对模型输出的边际贡献。                             表2所示。
                                           表1  不含预警函数特征的各模型预测性能
                                 训练集(56 464)                  测试集(14 117)                新试件数据(4 550)
                学习算法
                                    M RE /%  M AE /Mpa           M RE /%  M AE /Mpa                   M AE /Mpa
                           M SE                         M SE                         M SE      M RE
                XGBoost    12.023    13.9     1.892 7  18.704 7  21.64    2.254 6   88.050 2  181.49   7.7463
                 KNN      124.596 4  43.4     7.8     197.928    69.35    9.957 5  185.853 1  374.66  11.606 5
                AdaBoost  202.201   195.16   12.181   203.111 5  230.15   12.269 7  119.971 1  439.11  9.211 7
                  LR      494.090 9  231.84  17.283   504.472 9  233.43   17.494 7  284.287 4  584.41  14.527






















                                      图 5  不含预警函数特征下,基于 XGBoost 的预测模型预测结果

                64
                     2024 年 第 46 卷 第 11 期
                     无损检测
   97   98   99   100   101   102   103   104   105   106   107