Page 107 - 无损检测2021年第三期
P. 107

胡家铖, 等:

            一种改进的支持向量回归三轴管道漏磁缺陷量化方法


            的谷谷间距、 峰峰间距、 峰谷间距、 拐点间距、 特殊点                                          d w X i X j   
                                                                                    ( , )
                                                                           ex p -             
                                                                                
            间距、 峰谷差值、 体积、 表面积、 面能量等轴向、 径向                                             σ       
                                                                                
                                                                                              
                                                                                                 ,  i ≠j
                                                                          N
                                                                                       ( , )
            以及周向三轴信号共 53 个主要特征。其中特殊点                              p i j =            d w X i X j          ( 3 )
                                                                          ∑  ex p -      σ       
                                                                                   
                                                                                                 
                                                                                   
            的计算方法如式( 1 ) 所示。                                            j= 1 , j≠ i              

                                                                           
                                                                        0 , i= j
                                                                         
                                                                         
                      Y di _ left= Y v _ left+ α×D p v _ left  ( 1 )
                                                               式中:     为 X i  选择 X j  的概率, σ 为核宽度参数。
                                                                   p i j
                      Y di _ ri g ht= Y v _ ri g ht+ α×D p v _ ri g htt
                                                                   针对整个分类的平均准确率 f ω ) 如式( 4 ) 所
                                                                                               (
                                       ,        为双边峰谷
            式中: α 为特殊点系数; D p v _ left D p v _ ri g htt
                      ,                      ,      为双边        示, 其中 N 为样本的个数, 当正确分类, 即 y i = y j
            差值; Y v _ left Y v _ ri g ht  为双边谷值; Y di _ left Y di _ ri g ht
                                                               时, =1 ; 当错误分类时 y i j =0 ; 特征选择目标函
            特殊点值。                                                y i j
                                                               数 F ( ω ) 在 f ω ) 中加λ 正则化项, 如式( 5 ) 所示, 其
                                                                          (
            3  基于近邻成分分析的特征选择方法                                 中λ 为正则化参数。
                                                                                   1
               在对实际问题进行研究的过程中, 为了能够全                                       f w ) =   ∑∑    y i j p i j    ( 4 )
                                                                             (
                                                                                   N  i  j
            面准确地反映出事物的特征和发展规律, 往往需要
                                                                                            d
            尽可能多地考虑有关事物的多项数据指标, 避免遗                                       F ( w ) = f w ) λ ∑ w m         ( 5 )
                                                                                                2
                                                                                        -
                                                                                   (
                                                                                           m=1
            漏重要的信息       [ 6 ] 。但是对于管道缺陷尺寸量化 来                    不同尺度及不同λ 下均方根误差曲线如图8 所
            说, 长度、 宽度与深度等不同的学习任务所需要的特                          示。利用均方根误差来寻找最优的λ 值, 针对不同
            征不尽相同, 对于某一个特定的学习任务, 在特征全                          的尺度学习任务, 最优λ 值是不同的。在不同尺寸
            集中, 对当前学习任务起决定性作用的属性称为“ 相
            关特征”, 无关的属性称为“ 无关特征”。无关特征对
            于当前任务来说增加了计算量, 却无法提高量化的
            准确性。因此, 针对不同尺寸的量化任务需要从特
            征全集中选择出对指定任务有益的特征序列。笔者
            基于近邻成分分析对于上一节提取的缺陷三轴特征
            全集进行特征选择, 以量化准确率最高为目标, 通过
            1 阶近邻的方式得到特征全集对缺陷尺寸不同尺寸
            量化任务的权重系数, 从而选取出对不同尺寸量化
            任务最有效的特征属性。

                 近 邻 成 分 分 析 ( Nei g hbourhood Com p onents
            Anal y sis , NCA ) 是 Goldber g er等 [ 9 ] 在 2004 年提出
            的一种监督距离测度学习算法               [ 10 ] 。 NCA 随机选择
            近邻, 将留一 法 ( Leave-one-out , LOO ) 的交 叉验证
            结果最大化。 2012 年, Yan g 等基于 NCA 算法提出
            了一种新型特征选择方法, 其基本思想是通过添加
            一个正则项, 寻找使得 LOO 分类正确率最大的权
            重向量    [ 10 ] 。
                                                     , ),
                 如式 ( 2 ) 所 示, 假 设 样 本 集 T = {( X 1 Y 1
                              ,                   ,   ,…,
                , ),…,( X N Y N
            ( X 2 Y 2             )}, 其 中 F = { X 1 X 2
                }                                 , ,…,
            X N  d×N  为 d 维 的 样 本 特 征 集, Y = { Y 1 Y 2
               }                     ( , ) 为对于样本集
            Y N  1×N  为样本标签集, d w X i X j
                    ,                               为第 m
            T 中 X i X j  两个样本的度量距离, 其中 w m
            个特征的特征权重。
                                  d
                                      2
                      ( , )
                   d w X i X j = ∑  w m X im -X j m    ( 2 )         图 8  不同尺度及不同λ 下均方根误差曲线
                                 m=1
                                                                                                         5
                                                                                                        6


                                                                                       2021 年 第 43 卷 第 3 期
                                                                                               无损检测
   102   103   104   105   106   107   108   109   110   111   112