Page 64 - 无损检测2024年第三期
P. 64

周 浩, 等:
   基于 MFCC和 GMM 的瓷砖空鼓率识别系统及方法

   N -1 。                                             (           1            ( x- μ i C i x- μ i   
                                                                                          (
                                                                                                 )
                                                                                     )
                                                                                        - 1
                                                                                      T
                                                                                                    ,
   1.1.6 离散余弦变换                                     b i x ) =  ( 2π ) C i | 1 ex p -   2           
                                                                 D
                                                                             
                                                                             
                                                                                                   
                                                                 2
                                                                             
                                                                       2
                                                                  |
       将式( 3 ) 计算出的对数能量s ( m ) 进行离散余
                                                           i= 1 , 2 ,…, Q                       ( 7 )
   弦变换( DCT ), 得到 MFCC系数C ( n ) 为
                                                     式中: D 为特征参量维度;             为b i x ) 的均值向量;
                                                                                    (
                                                                            μ i
          M- 1                       ,  0<n ≤L
                                                        (
                                                                          (

  C ( n ) = ∑ s ( m ) cos                            σ i j j=1 ,…, D ) 为 b i x ) 所对应的特征矢量的第       j
                                                      2
                      
                     πn ( m -0.5 )   
                      
          m= 0             M                                                    2  ,…, σ iD   为 协 方 差
                                                                                      2

                                                     维分 量 的 方 差, C i = dia gσ i1
                                              ( 4 )
                                                     矩阵。
   式中: L 为 DCT 输出的系数个数, 即 MFCC系数的
                                                         λ 是由权重ω i     、 均值向量    μ i  、 协方差矩阵 C i
   维度 , L ≤ M 。
                                                     组成的 GMM 参数集, 表示一个由J 帧信号构成的
       实际应用中, 平稳信号常见的 MFCC 维度为
                                                     完整声信号所对应的 GMM 模型, 可表示为
   5~15 。式( 4 ) 计算得到的 C ( n )为标准的 MFCC
                                                                    , ,
                                                             λ= ω i μ i C i   ,   i= 1 , 2 ,…, Q  ( 8 )

   系数, 反映了信号的静态特征, 可通过C ( n ) 的一阶
                                                        λ 可以采用最大似然准则法通过期望最大
   或二阶差分来提取信号的动态特征。                                                                        [ 12 ]
                                                     ( Ex p ectationmaximization , EM ) 算法求得  。 EM
       C ( n ) 一阶差分d ( n ) 的计算公式为
                                                     算法的基本思想为: 从初始模型 λ 出发, 去估计另一
                      d ( n ) =                      个新模型λ' , 使 ( x|λ' ) ≥ p x|λ ); 得到的新模型
                                                                               (
                                                                   p
    C ( n+1 ) C ( n ), 0<n <K
             -                                       在下次迭代中作为新的初始模型进行估计, 如此反
       K
          k C ( n+ k ) -C ( n- k )                   复迭代直至达到收敛阈值后终止。迭代完成后的最


       
    ∑ k= 1                      , K ≤n <L-K
     
     
                  K                                        构成一个 GMM 参数模型。
              2      k 2                             终λ g
                ∑ k= 1
                                                          整个瓷砖空鼓率的识别流程如图2所示, 流程
       
    C ( n ) C ( n-1 ), L-K ≤n ≤L
         -
     
                                                     分为模型训练和模型测试两部分。实际应用时, 将
                                              ( 5 )
                                                     不同空鼓率瓷砖的多次敲击声分成两组, 其中一组
   式中: K 表示一阶差分的时间差, 可取1或2 。
                                                     作为训练样本, 另一组作为测试样本。首先对各个
       将一阶差分计算结果再次代入式( 5 ) 就可以得
                                                     训练样本进行处理, 以 MFCC 作为特征参数, 采用
   到 MFCC 的二阶差分参数。将 MFCC 的静态特
                                                     期望最大 EM 算法对训练样本进行 GMM 参数集
   征、 一阶差分及二阶差分参数进行混合, 最终可构成
                                                     的求取, 同时通过所有训练样本构建不同空鼓率瓷
   一个3L 维度的特征向量。
                                                     砖样本的 GMM 模型库; 然后对各个测试样本进行
   1.2 空鼓识别模型                                        MFCC特征参数和 GMM 参数集的求取, 并与训练
     对于采集到的瓷砖敲击声信号, 如果将整个声
                                                     样本 GMM 模型库中的参数模型进行比较, 通过似
   信号分成J 帧, 而每帧信号通过 MFCC方法提取得
                                                     然函数值L ( ) 的大小来判断测试样本与模型库中
                                                                y
   到3L 维度的特征向量, 则对整个声信号进行处理
                                                     的哪个样本最为接近, 进而完成瓷砖空鼓率的识别。
   后可得到一个J×3L ( J 行, 3 L 列) 的特征参数矩
                                                          似然函数值L ( ) 的计算公式如下
                                                                       y
   阵。由于特征参数矩阵的数据量较大, 不利于后续
                                                                                  (
   的分类、 识别处理, 因此采用高斯混合模型的方法,                                   L ( )   1     J  p y j| λ g )    ( 9 )
                                                                 y = l g
                                                                      J   ∑ j = 1
   利用其对多种数据的灵活处理能力, 进一步优化处                           式中:         , ,…,   , 为由各个测试样本的J

                                                          y= y 1 y 2    y J
   理数据过程。                                            帧信号特征向量构成的合集。测试样本与训练样本
       高斯混合模型采用由多个单高斯密度函数线性                          中某个样本的L ( ) 值越大, 表示二者的接近程度
                                                                     y
   加权组合的方法来逼近所要分析的特征参量 X , 其                         越高。

   表达式如下
                                                     2 系统介绍
                   Q
                     ωb (
       p x| λ ) = ∑ i i x ),   i= 1 , 2 ,…, Q ( 6 )
         (
                  i = 1                                为了对瓷砖空鼓率进行识别, 构建了一套由麦
   式中: Q 为单高斯概率密度函数 b i x ) 的个数或混                    克风、 声信号调理采集仪及上位机构成的试验测试
                                  (
                (
           为 b i x ) 对应的权重。                          系统, 系统的结构框图及实物如图3所示。麦克风
   合数; ω i
       单高斯概率密度函数b i x ) 可表示为                         用于瓷砖敲击声信号的接收, 声信号调理采集仪用
                            (
     0
    3
          2024年 第46卷 第3期
          无损检测
   59   60   61   62   63   64   65   66   67   68   69