Page 64 - 无损检测2024年第三期
P. 64
周 浩, 等:
基于 MFCC和 GMM 的瓷砖空鼓率识别系统及方法
N -1 。 ( 1 ( x- μ i C i x- μ i
(
)
)
- 1
T
,
1.1.6 离散余弦变换 b i x ) = ( 2π ) C i | 1 ex p - 2
D
2
2
|
将式( 3 ) 计算出的对数能量s ( m ) 进行离散余
i= 1 , 2 ,…, Q ( 7 )
弦变换( DCT ), 得到 MFCC系数C ( n ) 为
式中: D 为特征参量维度; 为b i x ) 的均值向量;
(
μ i
M- 1 , 0<n ≤L
(
(
C ( n ) = ∑ s ( m ) cos σ i j j=1 ,…, D ) 为 b i x ) 所对应的特征矢量的第 j
2
πn ( m -0.5 )
m= 0 M 2 ,…, σ iD 为 协 方 差
2
维分 量 的 方 差, C i = dia gσ i1
( 4 )
矩阵。
式中: L 为 DCT 输出的系数个数, 即 MFCC系数的
λ 是由权重ω i 、 均值向量 μ i 、 协方差矩阵 C i
维度 , L ≤ M 。
组成的 GMM 参数集, 表示一个由J 帧信号构成的
实际应用中, 平稳信号常见的 MFCC 维度为
完整声信号所对应的 GMM 模型, 可表示为
5~15 。式( 4 ) 计算得到的 C ( n )为标准的 MFCC
, ,
λ= ω i μ i C i , i= 1 , 2 ,…, Q ( 8 )
系数, 反映了信号的静态特征, 可通过C ( n ) 的一阶
λ 可以采用最大似然准则法通过期望最大
或二阶差分来提取信号的动态特征。 [ 12 ]
( Ex p ectationmaximization , EM ) 算法求得 。 EM
C ( n ) 一阶差分d ( n ) 的计算公式为
算法的基本思想为: 从初始模型 λ 出发, 去估计另一
d ( n ) = 个新模型λ' , 使 ( x|λ' ) ≥ p x|λ ); 得到的新模型
(
p
C ( n+1 ) C ( n ), 0<n <K
- 在下次迭代中作为新的初始模型进行估计, 如此反
K
k C ( n+ k ) -C ( n- k ) 复迭代直至达到收敛阈值后终止。迭代完成后的最
∑ k= 1 , K ≤n <L-K
K 构成一个 GMM 参数模型。
2 k 2 终λ g
∑ k= 1
整个瓷砖空鼓率的识别流程如图2所示, 流程
C ( n ) C ( n-1 ), L-K ≤n ≤L
-
分为模型训练和模型测试两部分。实际应用时, 将
( 5 )
不同空鼓率瓷砖的多次敲击声分成两组, 其中一组
式中: K 表示一阶差分的时间差, 可取1或2 。
作为训练样本, 另一组作为测试样本。首先对各个
将一阶差分计算结果再次代入式( 5 ) 就可以得
训练样本进行处理, 以 MFCC 作为特征参数, 采用
到 MFCC 的二阶差分参数。将 MFCC 的静态特
期望最大 EM 算法对训练样本进行 GMM 参数集
征、 一阶差分及二阶差分参数进行混合, 最终可构成
的求取, 同时通过所有训练样本构建不同空鼓率瓷
一个3L 维度的特征向量。
砖样本的 GMM 模型库; 然后对各个测试样本进行
1.2 空鼓识别模型 MFCC特征参数和 GMM 参数集的求取, 并与训练
对于采集到的瓷砖敲击声信号, 如果将整个声
样本 GMM 模型库中的参数模型进行比较, 通过似
信号分成J 帧, 而每帧信号通过 MFCC方法提取得
然函数值L ( ) 的大小来判断测试样本与模型库中
y
到3L 维度的特征向量, 则对整个声信号进行处理
的哪个样本最为接近, 进而完成瓷砖空鼓率的识别。
后可得到一个J×3L ( J 行, 3 L 列) 的特征参数矩
似然函数值L ( ) 的计算公式如下
y
阵。由于特征参数矩阵的数据量较大, 不利于后续
(
的分类、 识别处理, 因此采用高斯混合模型的方法, L ( ) 1 J p y j| λ g ) ( 9 )
y = l g
J ∑ j = 1
利用其对多种数据的灵活处理能力, 进一步优化处 式中: , ,…, , 为由各个测试样本的J
y= y 1 y 2 y J
理数据过程。 帧信号特征向量构成的合集。测试样本与训练样本
高斯混合模型采用由多个单高斯密度函数线性 中某个样本的L ( ) 值越大, 表示二者的接近程度
y
加权组合的方法来逼近所要分析的特征参量 X , 其 越高。
表达式如下
2 系统介绍
Q
ωb (
p x| λ ) = ∑ i i x ), i= 1 , 2 ,…, Q ( 6 )
(
i = 1 为了对瓷砖空鼓率进行识别, 构建了一套由麦
式中: Q 为单高斯概率密度函数 b i x ) 的个数或混 克风、 声信号调理采集仪及上位机构成的试验测试
(
(
为 b i x ) 对应的权重。 系统, 系统的结构框图及实物如图3所示。麦克风
合数; ω i
单高斯概率密度函数b i x ) 可表示为 用于瓷砖敲击声信号的接收, 声信号调理采集仪用
(
0
3
2024年 第46卷 第3期
无损检测

