集合经验模式分解

2024-05-08

集合经验模式分解(精选4篇)

集合经验模式分解 第1篇

柴油机表面振动信号比较复杂,多表现为非平稳、非线性的特征,其中包含着丰富的工作状态信息和故障特征信息,因此从中提取感兴趣的信号特征,可有效地识别柴油机工作状态和判断故障[1]。传统的时频分析方法虽然同时兼顾了时域和频域两个方面,但存在一些缺陷:例如短时傅里叶变换窗口固定;Wigner分布存在严重交叉干扰项;小波变换结果依赖小波基的选择和分解尺度,自适应性不好。利用上述方法分析振动信号提取故障信息,效果并不理想。

经验模式分解(empirical mode decomposition,EMD)是基于信号的局部特征时间尺度,将复杂的信号分解为有限的固有模态分量(intrinsic mode functions, IMFS)之和,是完全自适应的,尤其适用于分析非线性非平稳过程[2],近年来在旋转机械故障诊断中得到了广泛的应用[3,4,5]。但是EMD存在一个明显的不足之处即不可避免地存在模式混叠现象。为了克服这个缺点,Wu and Huang提出了集合经验模态分解(ensemble empirical mode decomposition, EEMD)方法,它是一种新的噪声辅助数据分析方法,使用这种方法能够明确地分离各个尺度,是对EMD算法改进的一个重大理论成果[6]。

本文首先简介了EMD和EEMD算法的基本原理,通过仿真信号比较两种方法的优劣,再选择EQ6BT柴油发动机作为试验对象,人为设置曲轴与轴承配合间隙,得到发动机三种技术状态,然后,测量一定工况下的振动信号,分别使用EMD和EEMD方法对其进行分解和比较分析。

1EMD算法的基本原理

经验模式分解法(empirical mode decomposition,EMD)是将原信号分解为一组称为固有模态函数( IMF) 的单分量信号,这些单分量信号满足如下两个条件:(1)在整个数据序列中,极值点的数量和过零点的数量必须相等或最多相差1个;(2)对于信号上任何一点局部极大值和局部极小值确定的包络线的均值为零。EMD的过程也称为“筛选”过程,具体步骤如下[7]:

给定信号x(t),用三次样条连接所有的局部极大值点得到上包络线,连接所有的局部极小值点得到下包络线,上下包络线的均值m11(t),x(t)与m11(t)的差值定义为h11(t),则:

h11(t)=x(t)-m11(t) (1)

h11(t)不是基本模式分量,可以把它按式(1)重复k次直到h1k(t)是一个基本模式分量,即

h1k(t)=h1(k-1)(t)-m1k(t) (2)

记做f1(t)=h1k(t),f1(t)是从信号中得到的第一个基本模式分量,从x(t)中减去f1(t)得到剩余信号

r1(t), r1(t)=x(t)-f1(t) (3)

再将r1(t)作为待分解的信号,重复式(1)~式(3)的步骤计算,按此过程依次分解得到fi(t),则有

直至所剩余信号rn(t)变成一个单调函数不能再筛选出基本模式分量为止。最后信号被分解成n个基本模式分量fi(t)和一个余项rn(t) 即

x(t)=i=1nfi(t)+rn(t) (5)

式(5)表明信号的经验模式分解具有完备性。

在经验模式分解出模式分量的基础上,对(5)式做Hilbert变换计算出瞬时频率wi(t),信号可以利用瞬时频率来表示。

x(t)=i=1nAi(t)ejwi(t)ti (6)

通过式(6)作出Hilbert边际谱来反映信号的幅值在整个频率段上的变化情况。

2EEMD算法的基本原理

研究表明,当数据由白噪声组成,且白噪声的尺度均匀分布在整个时间或时间-频率尺度上,EMD可以作为一个二进滤波器组。当数据不是纯的白噪声时,一些尺度会丢失,这样就会出现模式混叠现象。而现实中的所有数据都融合了信号和噪声,这种情况是普遍存在的,因此EMD的模式混叠现象是不可避免的。

所谓模式混叠,就是说可能是一个IMF分量包括了尺度差异较大的信号,或是一个相似尺度的信号出现在不同的IMF分量中。Huang认为模式混叠的原因是信号的间断现象,它的产生和极值点的选择有关[8]。信号间断不仅仅在时频分布中引起了严重的混叠,而且使单独的IMF分量缺乏物理意义。

集合经验模式分解是把包含了信号和有限幅值白噪声的全体测试均值定义为真实的IMF分量,其本质就是一种叠加高斯白噪声的多次EMD分解,利用了高斯白噪声具有频率均匀分布的统计特性,使加入噪声后的信号在不同尺度上具有连续性,尽管附加的噪声可能导致较小的信噪比,但其可以提供一个均一化的相关尺度分布以克服模式混叠,这种可行性已被文献[9]证实。

EEMD的算法过程如下[10]

(1) 初始化EMD执行总次数M,白噪声的幅值系数k, m=1;

(2) 执行第m次EMD试验:

a.在输入信号x(t)上加入一随机高斯白噪声序列nm(t),得到加噪的待处理信号xm(t);

xm(t)=x(t)+knm(t) (7)

b.用EMD分解xm(t),得到I个IMFcj,m(j=1,2,…,I),cj,m表示第m次试验分解出的第j个IMF;

c.若m<M,返回步骤(2),m=m+1;

(3) 对M次试验的每个IMF计算均值

c¯j=m=1ΜCj,mΜ(j=1,2,Ι,m=1,2,Μ) (8)

(4) 输出c¯j作为EEMD分解得到的第j个IMF, j=1,2,…,I

3仿真试验

给定一个仿真信号的解析表达式如式(9),在此信号基础上再加入幅值为0.25的噪声信号,采样频率为400 Hz,采样点数为500,其时域波形如图1所示。

x(t)=sin(40πt)+2sin(80πt+160) (9)

对该信号直接进行EMD得到如图2所示各IMF分量,对其进行Hilbert变换得到如图4所示的边际谱,对信号加入信噪比为5Eb的白噪声,执行EMD总次数M为200次的EEMD分解,得到如图3所示各I MF分量,并得到对应的边际谱如图5所示。

对比图2和图3可以看出,由于EEMD算法的基础依然是EMD,两种方法分析出来的IMF分量个数相同,经过EMD分解得到的前三个IMF分量发生了模式混叠,IMF2与IMF3分量完全失真,看不出任何含义,也就是说由于信号中噪声的影响,相近的特征时间尺度同时分布在前三个分量中,EMD无法辨别。而经过EEMD分解,前三个IMF分量更加平稳和规律,IMF2和IMF3分量通过M次平均还原了仿真信号中频率为40 Hz和20 Hz的正弦信号概貌,总的来说,EEMD高质量地分离出仿真信号中各个组成部分,有效地减弱了各IMF分量的模式混叠现象。这是因为多次EMD分解时,由于适度白噪声的引入,改变了信号中原有时间跨度,多方位的分析最终通过M次平均还原出原信号的本质。对比图4和图5,利用EMD分解结果并变换得到的边际谱频率成分杂乱,特征频率不显著,而通过EEMD方法变换后的边际谱分别在频率20 Hz和40 Hz左右出现明显峰值,对照原始信号频率可知其分别对应仿真信号中两个正弦信号频率,由此可知EEMD方法效果是明显的。

4故障实例分析

4.1振动信号采集

本文选择东风EQ6BT柴油发动机作为试验对象,曲轴轴承故障是发动机常见的机械故障现象,通过设置曲轴轴承配合间隙,可以得到发动机三种不同的技术状态,分别是正常状态(曲轴轴承配合间隙正常),轻微故障状态(曲轴轴承配合间隙0.2 mm),严重故障状态(曲轴轴承配合间隙0.4 mm)。传感器使用美国PCB公司生产的振动传感器(频响范围为0~10 kHz),将其放置在曲轴箱与缸体结合处右侧,发动机转速1 800 r/min,采样频率25 600 Hz,采样点数为8 192,将发动机预热10 min,采集三种不同技术状态下的振动信号, 如图6所示。

4.2振动信号处理和分析

对采集到的发动机振动信号分别进行EMD和EEMD分解,使用EEMD处理时,加入与原始信号信噪比为5 Eb的随机白噪声,EMD总次数M为200次。在EMD和EEMD分解出模式分量的基础上进行Hilbert变换,得到三种工作状态下的边际谱图,如图7、图8所示。

通过仿真试验可以得知,振动信号经EEMD分解后可以有效地减轻EMD分解的模式混叠问题,能明显地降低噪声等因素对振动信号的干扰,更好地反映不同工作状态下振动信号的本质。根据文献[11]中的作者得出的结论:在转速为1 800 r/min下,发动机曲轴轴承故障的特征频段为1 900 Hz—2 100 Hz,本文边际谱图关注的频段范围是1 800 Hz—2 300 Hz。对比图7和图8可以看出,经EMD分解后,在特征频段(1 900 Hz—2 100 Hz)范围内,由于IMF分量出现模式混叠,轻微故障和严重故障边际谱曲线出现交错,而经过EEMD方法的分解,轻微故障和严重故障两条曲线较明显分离,随着故障间隙增大,在特征频段内纵坐标值(幅值)呈增长趋势。对特征频段能量进行累加,得到结果如表1所示,EMD方法在轻微故障和严重故障时能量差别不大,不便于有效区分,而通过EEMD方法得到的两种状态能量差异明显。通过对能量累加比较,能够对故障状态进行准确识别。

5结论

(1) EEMD方法通过多次添加适度随机白噪声,使得EMD能从尽可能多的尺度分析信号,有效抑制了EMD的模式混叠现象,分解后的IMF分量包含了信号更客观的信息,除了计算负担有所增加(几百次的EMD分解耗时长)外,性能比EMD更加优越。

(2) 在故障诊断实例中,引入EEMD对柴油发动机表面振动信号进行处理,明显地降低了噪声等因素对原始振动信号的干扰,Hilbert变换后的边际谱图明显地反映出三种工作状态的特征,通过对特征频段的能量进行累加,可以有效区分不同的故障状态,有利于对机械故障进行准确诊断。

摘要:针对柴油机表面振动信号非平稳、非线性等特点,引入集合经验模式分解(EEMD)的信号分析方法,对原始振动信号叠加适当的随机高斯白噪声,从而改变信号的局部时间跨度,有效抑制了经验模式分解(EMD)的模式混叠现象。通过Hilbert变换作边际谱曲线以提取故障特征信息。仿真试验和发动机故障实例证实了EEMD算法可以提高振动信号的分析精度,在柴油机机械故障诊断领域应用前景广泛。

关键词:柴油机,机械故障诊断,集合经验模式分解,经验模式分解,边际谱曲线

参考文献

[1]朱双华.汽车发动机故障诊断方法研究.长沙:中南大学硕士论文,2007

[2]郑天翔,杨力华.经验模式分解算法的探讨和改进.中山大学学报,2007;46(1)1—6

[3]段礼祥,张来斌,李刚,等.基于EMD的天然气发动机供气系统故障诊断方法.车用发动机,2010;(2):72—76

[4]任玥.基于Hilbert-Huang变换的滚动轴承智能诊断方法研究.成都:西南交通大学硕士论文,2007

[5]徐红梅,郝志勇,杨陈,等.基于EMD和HHT的内燃机噪声信号时频特性研究.内燃机工程,2008;(6):60—64

[6]Wu Z H,Huang N E.Ensemble empirical mode decomposition:a noise assisted data analysis method.Advances in Adaptive Data Anal-ysis,2009;1(1):1—41

[7]于德介,程军圣,杨宇.机械故障诊断的Hilbert-Huang变换方法.北京:科学出版社,2007:27—30

[8]Huang N E,Shen Z,Long S R,et al.The empirical mode decomposi-tion and the Hilbert spectrum for nonlinear and nonstationary time series analysis.Proceedings of the Royal Society,1998,454(1971):903—995

[9]Flandrin P,Goncalves P,Rilling G.EMD equivalent filter Banks,form interpretation to applications.Hilbert-Huang Transform:Introduction and Applications,World Scientific,Singapore,2005;360:67—87

[10]张佳芳.基于EEMD的车内语音增强研究.杭州:浙江大学硕士论文,2007

集合经验模式分解 第2篇

风能作为一种用之不竭、环境友好的可再生能源,近年来装机容量一直保持较高的年增长速度。 然而风能的混沌特性和随机特性使其输出功率的波动速度较快,波动范围较大。风电并网后对电力系统调度、电压及无功控制造成困难[1]。如果能及时有效地对风速进行预测,不仅可以减少电力系统备用容量、降低系统运行成本,还可以减轻风电对电网造成的不利影响,从而提高风电竞争力[2]。

目前,国内对风速预测进行了大量研究,建立的模型[3,4,5,6,7,8,9]主要有:时间序列模型,支持向量机模型和神经网络模型等,取得了较好的预测效果,然而这些模型同样存在着一些问题。时间序列模型高阶模型参数估计难度大、低阶模型预测精度低。高斯过程回归模型和支持向量机模型的预测结果在一定程度上受到核函数的选择和参数优化等问题的影响。需要采用较好的智能算法进行模型优化才能取得较好的预测效果[5]。人工神经网络模型应用较为成熟,作为一种数据驱动算法,具有逼近任意非线性函数的能力,可以映射出序列间复杂的非线性关系,从而在风速和风功率预测中得到广泛应用[6,7,8]。 然而传统的人工神经网络方法存在一些问题,如算法运行时间长,容易陷入局部极小等。

极限学习机[10]是huang等于2006年提出的一类性能优良的新型单隐层前向神经网络(Single-hidden layer feedforward neural networks, SLFNs),该算法在随机选择输入层权值和隐层神经元阈值的前提下,仅通过一步计算即可求得网络输出权值,同传统神经网络相比,极限学习机极大地提高了网络的泛化能力和学习速度,具有较强的非线性拟合能力。经过学者努力,极限学习机已在模式分类[11]、暂态稳定评估[12]、非线性拟合预测[13]等方面得到广泛应用。然而风速序列是一种具有非线性和非平稳性的特殊序列信号,极限学习机虽可以很好地拟合风速的非线性部分,但是风速的非平稳部分会对预测效果造成较大影响,所以降低风速的非平稳性显得尤为重要。集合经验模态分解可以将一个复杂的非平稳性信号分解成不同频率段的信号,从而有效降低序列的非平稳性。针对风速的非平稳性和非线性特性,本文提出一种基于集合经验模态分解和极限学习机的新型风速组合预测模型。 实例研究表明,本文所提模型取得了较好的预测效果。

1 改进极限学习机预测模型

1.1 极限学习机原理

极限学习机是一种新型的单隐层前向神经网络[10,11],对于N个不同样本,含有L个节点且激发函数为f(x) 的极限学习机数学模型可表示为

式中:bi为连接第i个隐层节点和输出神经元之间的连接权向量:wi=[wi1,wi2,L ,win]T是连接第i个隐层节点和输入节点的权重;bi为第i个隐层节点的偏差;yj为第j个节点的输出值。wi×xj构成wi和xj的内积。网络的训练相当于零误差逼近N个训练样本,即存在。使得

上式可表示为

式(3)中,H为网络隐层输出矩阵,H的第i列表示第i个隐层节点对应于输入的第i个隐层神经元的输出向量。

本文选择基函数神经网络(Radical Basis Function, RBF) 作为激励函数, 其表达式为,文献[10]已经证明:当激励函数无限可微时,网络参数并不需要全部进行调整,输入连接权值w和隐层节点偏置b在训练开始时可随机选择,而输出连接权值可通过求解线性方程组(4)的最小二乘解来求得。

其解为

其中,H2为隐层输出矩阵H的Moore-Penrose广义逆。

极限学习机的学习算法过程可分为三步:

(1) 随机设置输入权值wi以及偏置bi,

(2)计算隐层输出矩阵H;

(3)计算输出权值

相比于传统的神经网络,极限学习机在训练过程中不需要调整wi和bi的值,只需相应的拟合出值,便可获得一个全局最优解,训练速度显著提升,且不会陷入局部最优。

1.2 极限学习机网络结构的确定

极限学习机的拟合性能在一定程度上受到网络结构的影响[14],对于本文用于风速预测的极限学习机模型来说,输入层神经元个数为相空间重构的饱和输入维数,输出层有一个神经元,唯一不能确定的是隐含层神经元个数。如果隐含层神经元设计过少,则不能对序列进行很好的拟合,设计过多会造成运算成本的提升。本文运用误差最小极限学习机算法[14]( Error Minimized Extreme Learning Machine,EM-ELM)来确定极限学习机的结构。

给定一个训练集。激活函数g(x) ,最大的隐节点个数,期望的学习误差ε :运用EM-ELM算法对极限学习机网络结构进行优化的步骤如下[14]:

Step 1:初始化过程

(1)初始化一个有L0个隐节点的单隐层前向神经网络,L0为一人为设定小的正整数;

(2)计算隐藏层输出矩阵H1;

(3)计算相应残差E(H1)。

Step 2:学习过程

本文设置时进行以下迭代:

(1)k k 1;

(2)随机增加Lk1个隐节点,总隐节点数目为:LkLk1Lk1,相应隐藏层输出矩阵

(3)计算残差E Hk1。

2 样本设计

2.1 集合经验模态分解[16]

集合经验模态分解是一种新型的自适应序列分析技术,EEMD改进了经验模态分解[15](EMD)的 “模态混叠(mode mixing)”问题。首先介绍经验模态分解的原理和信号分解步骤,经验模态分解可将存在于原序列中不同特征的趋势逐级筛选出来,得到具有相同特征的固有模态分量(Intrinsic mode function,IMF),固有模态分量需满足如下两个条件:1) IMF序列中的零点数与极点数相差0个或1个; 2) IMF序列中局部极小值点定义的包络线和局部极大值点定义的包络线均值为0。

对于某风功率序列x(t),求得序列x(t)中所有局部极大值和极小值。采用三次样条函数进行插值求出上包络线umax(t) 和下包络线umin(t) 的局部平均值m(t) ,其中m1(t) [bmax(t) bmin(t)] / 2 ,提取h1(t) x(t) m1(t) ,判断h1(t) 是否满足固有模态分量条件,是则h1(t) 就是第一个固有模态分量,不是则将h1(t) 作为原始序列重复上述分解步骤。直到经过n次筛选后的差值hn(t ) 满足固有模态分量条件, 称为一个IMF,记为C1(t ) hn(t ) 。得到C1(t) 后,根据式(6)从信号x(t) 中得到剩余分量r1(t) :

将r1(t) 作为原始序列,重复上述步骤可得到其余的IMF分量,当余量rn(t ) 为单调函数或很小时终止。则原有风速信号可分解为

经验模态分解具有一定的先进性,但上述算法在一些情况下会出现模态混叠现象[16]。集合经验模态分解[16]的基本思想是利用噪声的统计特性来有效避免混叠现象。集合经验模态分解步骤如下:首先向原始风速序列{x(t)}中加入白噪声序列,加入的白噪音序列应服从(0,(ae)2) 的正态分布,其中a 为噪音的强度参数,ε 为信号的标准差。文献[16] 认为:当r为100, 从[0.1,0.3]之间选择时能够取得较好的分解结果。因此在本文中选r等于100,  等于0.25; 然后使用EMD将加入白噪声后的风功率序列分解为若干个本征模态分量cn(t ) 和一个剩余分量rN(t ) ;重复上述两个步骤共r次,每次加入的白噪声序列的幅值不同;最后将r次分解得到的IMF值求整体平均,将其作为原信号的最终IMF分量。

为避免极限学习机模型输入维数选取的任意性和序列信息丢失问题,对集合经验模态分解得到的各分量进行相空间重构,并以重构后相空间的饱和嵌入维数m作为极限学习机预测模型的输入维数。

2.2 相空间重构

Takens已经证明了适当选取延迟时间和嵌入维数会使重构后的相空间反映出系统状态随时间演化的规律。对于风速序列{x(i)},i =1,2,··· ,N ,求取延迟时间 和嵌入维数m是相空间重构的关键所在, 重构相空间已有很多较为成熟的方法。本文运用互信息法[17]求时间延迟,虚假紧邻法[18]求嵌入维数。

3 实例分析

3.1 评判指标

合理的选择预测误差指标对评定模型性能有着重要作用。本文选取平均绝对误差emae、均方根误差erms作为误差评判指标。emae和erms如式(8)、 式(9)所示。

3.2 样本设计

以广西金紫山风电场某号机组数据采集与监视控制系统(Supervisory Control And Data Acquisition, SCADA)连续720 h风速序列作为研究对象。该系统采样周期为10 min,为满足研究需要, 对数据进行小时平均化处理。处理后的风速序列如图1所示。

首先对风速序列进行集合经验模态分解,分解结果如图2所示。

然后对各个分量进行相空间生构,对各个分量分别运用互信息法[17]求时间延迟,虚假紧邻法[18]求嵌入维数,求得的结果如表1 所示。重构相空间后,每个分量可以构成T个相点,T N (m 1) , N为原始数据样本数量。 T作为重构相空间向量数,本文选取前(T 100)组相空间重构后的数据作为训练样本,后100 组相空间重构后数据作为测试样本来检验预测模型的性能,进行提前一个小时的风速预测研究。运用EM-ELM算法优化各子序列极限学习机的网络结构,得到的隐含层神经元个数如表2 所示。

3.3 预测结果分析

对各个分量分布采用建立的EM-ELM预测模型进行预测,将各个分类的预测结果叠加得到风速预测结果,如图3所示。

为了对比研究,本文还同时采用以下两种模型进行风速预测。

第一种模型:对集合经验模态分解和相空间重构后的各分量分别采用ELMAN神经网络进行预测,然后对各分量预测值叠加得到风速预测结果。

第二种模型:采用最小二乘支持向量(Least squares support vector machine, LSSVM)机对各分量分别建模预测,然后对集合经验模态分解和相空间重构后各分量的预测值叠加得到风速预测结果。其中采用径向基(RBF)函数作为LSSVM核函数,并运用网格搜索算法优化LSSVM模型超参数。最后将各分量预测结果进行叠加得到风速预测值,本文称为LSSVM模型。

对三种模型的预测结果进行误差性能分析,三种模型的性能指标如表3所示。

从图3可以看出,本文所提的集合经验分解和改进极限学习机的组合预测模型可以对风速序列进行很好的跟踪,取得了较好的预测效果。从表3可以看出,本文模型与其他两种模型的对比研究表明了本文模型的先进性。

4 结论

风速的非平稳性和非线性加大了风速预测模型的拟合难度,本文结合集合经验模态分解可有效分析非平稳序列的特点和极限学习机良好的非线性拟合能力,提出一种基于集合经验模态分解和极限学习机的短期风速预测方法,通过实例研究得到以下结论:

1)本文提出的集合经验模态分解和极限学习机的短期风速组合预测模型可以有效降低风速序列的非平稳性特征,使模型可以更好地拟合风速信号, 从而进一步提高算法精度。

2)极限学习机具有较强的非线性学习能力, 用于风速预测取得了较好的预测结果。

3)本文所提的预测模型与另外两种模型的对比研究表明,本文提出的预测模型在风速预测方面的优势,具有较高的工程应用价值。

摘要:提出一种基于集合经验模态分解(Ensemble empirical mode decomposition)和改进极限学习机(Improved Extreme Learning Machine,IELM)的新型短期风速组合预测模型。采用集合经验模态分解将风速序列分解成不同频段的分量,以降低序列的非平稳性。使用改进极限学习机对各分量分别建模预测,为避免极限学习机输入维数选取的随意性和分量信息丢失等问题,先对各分量重构相空间,最后将各分量预测结果叠加得到最终预测结果。实例研究表明,所提的组合预测模型具有较高的预测精度。

集合经验模式分解 第3篇

光照问题是人脸识别中面临的一大难题,相同人脸图像在光照条件下的差异有时远大于不同人脸图像在相同光照条件下的差异。针对光照问题已有许多人脸光照处理算法,主要分为三类:基于预处理和归一化的方法、基于人脸光照不变特征提取的方法、基于三维人脸建模的方法。基于预处理和归一化方法的主要思想是在人脸识别前对其进行处理,将其转化为标准形式,然后用标准形式的人脸进行人脸判别,该类算法主要有直方图均衡、伽玛矫正、对数变换等,这些方法不能有效克服局部光照引起的人脸变化。基于人脸光照不变特征提取方法的基本思想是提取人脸图像光照不敏感特征[3],主要方法有商图像、自商图像、边缘图等。局部二值模式[4]是光照不变的人脸识别算法,该方法主要记录像素点与其局部邻域像素点之间的对比关系,通过这种方式能够有效消除光照对人脸图像的影响。基于三维人脸建模的方法可构建生成人脸模型,该模型能重组不同姿态、不同光照条件下的人脸图像。具有代表性的方法有主成分分析、线性判别分析和基于这些方法的改进方法。光照锥也属于该类方法,其主要原理是通过不同光照的人脸图像形成光照凸形锥,能近似形成不同光照条件下的人脸图像。但该类方法需要大量不同光照条件下的人脸图像作为训练样本,在实际应用中受到一定限制。

经验模式分解算法是一种完全由数据驱动的自适应非线性非平稳时变信号分解方法,该方法可以将数据从高频到低频分解成具有物理意义的少数几个固有模态函数(IMF)分量和一个余量。本文首先使用一维经验模式分解算法对人脸图像进行水平方向和垂直方向的一层经验模式分解,然后将水平方向和垂直方向的人脸图像相加。人脸图像重建完成后运用梯度脸算法增强其高频细节成分。

1 算法介绍

1.1 图像对数变换

对任意灰度人脸图像的光照分量L(x,y)和反射分量R(x,y)的乘积可以看成是原人脸图像I(x,y):

其中,L(x,y)对应于图像的慢变换部分,R(x,y)对应图像的快变换部分。对(1)式两边取对数,得:

从式(1)和式(2)中可以看出,对于时间域的人脸图像,光照分量L(x,y)与反射分量R(x,y)是相乘关系,而在对数域中就变成了相加关系。因此在对数域中对图像进行光照处理即减去相对应的低频分量,类似于进行高通滤波处理。

1.2 一维经验模式分解

经验模式分解是一种自适应分解方法,其基本假设为任何数据都由一组不同的、简单的固有振动模态组成。在任何一时间点,数据中可能共存着不同的、叠加在一起的振荡模态,由这些不同的振荡模态构成复杂的数据。

经验模式分解是将原始输入数据信号x(t)分解为一系列的固有模态函数(IMF),分解步骤如下:

(1)找到信号x(t)的所有局部极大值和局部极小值。

(2)利用三次样条插值方法分别计算极小值插值和极大值插值,并得到对应信号包络emin(t)和emax(t)。

(3)计算局部均值m(t)=(emin(t)+emax(t))/2。

(4)原输入信号减去局部均值得到振荡信号:h(t)=x(t)-m(t)。

(5)当h(t)满足IMF条件时,h(t)就成为一个IMF;否则,用h(t)替换步骤1中的x(t)并重复步骤1到4。

(6)令c1=h(t),则c1为第一个IMF,对应的余量r1=x(t)-c1。当r1仍包含原数据中的频率信息时,将r1作为新的信息重复上述所有步骤,得到第二个IMF分量,以此类推,得到r1-c2=r2…,rn-1-cn=rn。筛分停止条件为:

经过上述分解过程,信号最终被分解为n个IMF分量和一个余量。原始信号可以表示为:

1.3 梯度脸算法

梯度脸算法如下:

对于任意灰度图像I(x,y),像素点(x,y)在x方向的邻域点为(x+Δx,y),则:

式(3)-式(1)得:

近似光滑且变化缓慢,则:

当Δx趋近于0时,由式(5)有:

同理,在y方向有:

式(7)除以式(6)得:

根据光照模型,R(x,y)是光照不变分量,因此图像y方向的梯度与x方向的梯度的比值也是光照不变的。定义梯度脸如下:

其中,

分别为图像I(x,y)在y方向与x方向的梯度,且G∈[-π,π]。实际应用中,为了计算梯度脸,首先需要计算人脸图像在x方向、y方向的梯度,为了能成功计算梯度,需要高斯核函数光滑人脸图像,即人脸图像与高斯核函数卷积后再分别计算x方向和y方向的梯度。高斯核函数表达式为:

其中,σ为高斯核函数的标准差。

2 实验

2.1 人脸库介绍

本文采用Yale B正面人脸库进行实验,该数据库共包含10个人的9种不同姿态,每种姿态又包含64种不同的光照情况。因为本文只研究光照处理问题,所以实验中只使用正面姿态的人脸图像。人脸图像尺寸为128×128,将所有图像按照入射光的不同角度分为5个子集。角度小于12°(共70个样本)为子集1;角度在13~25°(共120个样本)为子集2;角度在26~50°(共120个样本)为子集3;角度在51~77°(共140个样本)为子集4;角度大于77°(共190个样本)为子集5。

实验时,子集1作为训练样本,其余子集作为测试样本。

2.2 实验参数选择

本文中,合理选择参数,人脸识别能达到较好的效果。选择经验模式分解的层数为1层,式(10)中的σ参数值选择为0.7。

人脸图像光照补偿后,规范化其均值和方差分别为0和1,利用主成分分析法提取人脸特征(特征向量数为50),在进行人脸分类判别时,采用基于余弦距离的k近邻分类器,k取值选为3。

2.3 实验结果对比

本文将现有部分人脸识别算法的实验结果与文本所提方法的识别结果作比较。表1中,DCT的平均错误识别率为0.55%,OLHE的平均错误识别率为0.9%,Tan的平均错误识别率为1.94%,Vu的平均错误识别率为1.75%,本文所提方法的平均错误识别率为0.18%。

3 结语

本文首先对人脸图像进行水平方向和垂直方向上的一维经验模式分解,将分解后的图像两张相融合,重建后的人脸图像用梯度脸算法对其高频成分增强。用主成分分析法对图像降维,分类器为基于余弦距离的k近邻分类器。Yale B正面人脸库实验结果表明,该算法对不同角度的光照具有一定抑制作用,能有效进行光照处理。后续研究将在更大型的人脸库上测试本算法的有效性。

参考文献

[1]AGRI KAYMAK,SARICI R,UAR A.Illumination invariant face recognition using principal component analysis an overview[M].Berlin:Springer,2015.

[2]范守科,朱明.基于加权分块稀疏表示的光照鲁棒性人脸识别[J].计算机应用研究,2015,32(5):1563-1567+1571.

[3]HU HAIFENG.Illumination invariant face recognition based on dual-tree complex wavelet transform[J].Iet Computer Vision,2015,9(2):163-173.

[4]AHONEN T,HADID A,PIETIKAIENE M.Face description with local binary patterns:application to face recognition[J].IEEETrans on Pattern Analysis and Machine Intelligence,2006,28(12):2037-2041.

[5]ZHANG TAIPING,TANG YUANYAN,FANG BIN,et al.Face recognition under varying illumination using gradientfaces.[J].IEEE Transaction,2009,18(11):2599-606.

[6]CHEN WEILONG,MENG J E,WU SHIQIAN.Illumination compensation and normalization for robust face recognition using discrete cosine transform in logarithm domain[J].IEEE Transaction,2006,36(2):458-466.

[7]LEE P,WU S,HUNG Y.Illumination compensation using oriented local histogram equalization and its application to face recognition[J].IEEE Transaction,2012,21(9):4290-4289.

[8]X TAN B.TRIGGS.Enhanced local texture feature sets for trans[J].Image Process,2010(19):4177-4189.

集合经验模式分解 第4篇

液压泵是整个液压系统的动力源,它的性能好坏不仅直接影响整个液压系统,甚至对设备的正常运行产生决定性的影响[1],因此,对液压泵进行故障预测具有重要的理论价值和现实意义。

液压泵出现故障时,其振动信号因调制现象会呈现非平稳特性。经验模式分解(empirical mode decomposition, EMD)[2]作为一种新型的信号处理方法适合处理非线性非平稳信号,但EMD方法存在模态混叠现象,这大大限制了它在实际中的应用。集总经验模式分解(ensemble empirical mode decomposition,EEMD)方法[3]是EMD方法的改进,该方法利用高斯白噪声频率均匀分布的统计特性,使加入高斯白噪声后的信号在不同尺度上具有连续性,从而有效地解决了模态混叠问题。

故障预测方法一般分为基于模型的预测方法、基于知识的预测方法和基于数据的预测方法三大类[4]。基于模型的预测方法需要建立系统精确的数学模型;基于知识的预测方法不太适合定量计算,在实际应用中受到一定的限制;基于数据的预测方法是目前研究比较多的预测方法,主要有时间序列分析、灰色预测、支持向量机预测、神经网络预测等。

基于结构风险最小化的支持向量机(support vector machine, SVM)是一种新的机器学习方法,它在非线性时间序列领域中取得了不错的预测结果,较好地解决了小样本、非线性、过拟合和局部极小值等问题,且泛化推广能力优异[5],因此,本文提出了一种基于EEMD和支持向量机的液压泵故障预测方法。

1 液压泵故障预测流程

图1为基于EEMD和支持向量机的故障预测原理流程图。首先将采集到的振动信号通过EEMD进行分解,选取包含主要故障信息的IMF分量进行平滑能量算子解调;其次,应用小波包理论提取包络信号的各个频段能量,并与幅值域量纲一参数共同组成故障特征向量;再次,将小波包分解与支持向量机回归模型相结合对所提取的特征向量建立预测模型,预测特征向量的变化趋势;最后,通过故障映射模型对特征向量进行故障识别,判断可能发生的故障。

2 基于EEMD的平滑能量算子解调方法

2.1 液压泵振动信号的采集

选取型号为SY-10MCY14-1EL的斜盘式轴向柱塞泵为研究对象,柱塞数为7,液压泵的额定转速为1500r/min;驱动电机型号为Y132M-4,额定转速为1480r/min。由于泵轴实际转速为1480r/min,故转轴频率为1480/60=24.67Hz,柱塞泵有7个柱塞,所以滑靴撞击斜盘的冲击振动基频为24.6×7=172.7≈173Hz。

系统压力为10MPa,采样频率为50kHz时,液压泵正常状态下泵端盖0~20kHz频段的功率谱密度如图2所示。从图2中可以看出振动信号的能量主要集中在3~5kHz频段,高频谐振峰值大约在3.8kHz左右。由此可以判断,滑靴与斜盘撞击的微弱信号被高频振荡信号调制以共振的形式传递出来,所以对3~5kHz频段的信号进行分析,可获得丰富的故障信息,有利于故障的特征提取。

2.2 振动信号的EEMD分解和能量算子解调

本文重点研究松靴和斜盘磨损这两种故障形式。松靴柱塞和磨损的斜盘是由泵的维修部门提供的,在做实验时,用故障元件替换正常元件,采集泵端盖的振动信号用于泵的故障预测分析。

对各种故障状态下的振动信号进行EEMD分解[6],得到14个IMF分量和1个残余分量R,每个IMF分量其实就是一个频率簇。此处仅给出一个柱塞松靴故障下的EEMD分解,如图3所示。

为了进一步获取故障信息,需要对EEMD分解得到的IMF分量做进一步的包络分析,由于该振动信号的能量主要集中在高频分量处,所以需要对EEMD分解得到的分量进行平滑能量算子解调[7],得到结果如图4所示。

从图4中可以看出,频率成分集中在173Hz及其倍频上,与正常状态的各频率成分功率谱密度幅值比较,柱塞泵发生故障时各频段的能量发生了变化且幅值有所不同,但不能通过分析故障特征频率来判断是否发生了故障及发生了何种故障,需要大量地采集柱塞泵在各种状态下的样本进行分析。

(d)斜盘磨损

由于柱塞泵在各种状态下各频段的能量发生了变化,因此对包络信号进行小波包分解,用各频带的能量占总能量的百分比构造信号的特征向量,用来判断柱塞泵的运行状态。

3 液压泵故障特征提取

3.1 信号的幅值域特征提取

常用的量纲一特征参数有波形指标(Sf)、峰值指标(Cf)、脉冲指标(If)、裕度指标(CLf)、峭度指标(Kv),由于它们和机器的工作条件关系不大,只取决于概率密度函数p(x)的形状[8],所以为了取得较好的预测效果,将它们引入到特征向量之中。

液压泵振动信号的采样频率为50kHz,每0.4s计算一次指标,作为一个样本。首先得到故障的包络解调信号,然后利用隔点采样的方法将采样频率由50kHz降至2kHz,数据长度为800点,最后利用该数据计算一组幅值域指标。表1仅给出了4种不同状态下的一组数据样本。

3.2 信号的时频域特征提取

通过对振动信号的包络解调分析可以看出,不同状态下相同频带内信号的能量会有较大的差别,在各频率成分信号的能量中,包含着丰富的故障信息,某种或者几种频率成分能量的改变即可以识别一种故障。因此,本文给出一种基于小波包分析的频带能量特征提取方法。该方法首先利用小波包分解提取包络信号各频带的系数,通过小波包重构算法对各分解系数进行信号重构;然后根据信号能量的定义计算各频带信号的能量;最后用各频带信号的能量占总能量的百分比作为特征构造特征向量。

以一个柱塞松靴故障为例来说明小波包分解频带能量的特征提取过程。由振动信号的包络解调分析可知能量主要集中在1kHz以内,所以利用隔点采样的方法将采样频率由50kHz降至2kHz,数据长度为800点。

首先,对采集的信号进行小波包分解,分别提取第3层从低频到高频8个频率成分的信号特征。表2所示为各节点所对应的频率范围。

其次,对信号在各节点进行重构,重构信号为S3j(j=0,1,…,7),设S3j对应的能量为E3j(j=0,1,…,7),则各频带的能量为

E3j=|S3j(t)|2dt=k=1n|xjk|2(1)

j=0,1,…,7 k=1,2,…,n

式中,xjk为重构信号S3j的离散点幅值。

以各频带的能量为元素构造能量特征向量:

K=(E30,E31,E32,E33,E34,E35,E36,E37) (2)

最后,对特征向量K进行归一化处理[9],令

E=j=07|E3j|(3)

则归一化的特征向量T*为

T*=(E30/E,E31/E,…,E37/E) (4)

表3所示为不同状态下各频带能量表征的特征向量。

由包络分析可以看出,液压泵工作的故障特征频率主要集中在173Hz及其倍频上,各种状态下只是幅值有所不同,因此选用173Hz及其倍频所在频率范围的能量结合幅值域量纲一参数作为故障特征向量,为后续的故障预测奠定基础。表4所示为4种状态下的特征向量样本。

4 支持向量机预测模型的建立和验证

4.1 支持向量机预测模型

对于时间序列{xt}(t=1,2,…,N),取前面n个数值作为训练样本,其余作为验证样本。为更有效地利用有限的数据,对时间序列{xt}进行相空间重构,即将一维的时间序列转化为矩阵形式以尽可能多地挖掘数据的信息量,则用于支持向量机学习的样本为[10,11,12]

X=[x1x2xmx2x3xm+1xn-mxn-m+1xn-1]Y=[xm+1xm+2xn]

式中,m为模型的嵌入维数。

则可建立映射f:RmR:

x^t+1=f(xt,xt-1,,xt-m+1)

式中,x^t+1为t时刻的提前一步预测值。

对训练样本可以按照下面的回归函数进行训练:

yt=k=1n-mαkΚ(xk,xt-m)+b

t=m+1,m+2,…,n

式中,αk∈R为拉格朗日乘子;K(·)为满足Mercer条件的核函数;b∈R为偏置。

由于xn-m+1=(xn-m+1,xn-m+2,…,xn),则第一步预测为

x^n+1=k=1n-mαkΚ(xk,xn-m+1)+b

得到xn-m+2=(xn-m+2,xn-m+3,,xn,x^n+1),则第二步预测为

x^n+2=k=1n-mαkΚ(xk,xn-m+2)+b

一般可以得到第l步预测:

x^n+l=k=1n-mαkΚ(xk,xn-m+l)+b

xn-m+l=(xn-m+l,,x^n+1,,x^n+l-1)

4.2 预测模型的建立与验证

采用径向基函数k(x,y)=exp(σ2(x-y)2)(σ为径向基函数核的宽度),利用粒子群算法选择支持向量机的参数。液压泵振动信号的采样频率为50kHz,每0.4s计算一次指标,作为一个样本。以液压泵由正常状态变为松靴故障过程中的波形指标时间序列为例,采集40个样本,取前30个作为训练样本,后10个作为验证样本。图5所示为波形指标序列。

根据波形指标序列建立支持向量机回归模型,嵌入维数为4,经粒子群算法计算得到惩罚因子C=4,核参数G=1/σ2=0.125,预测的均方误差MSE=0.0082,相关系数R=97.0376%,虽然预测值精度较高,但是没有很好地反映数据的变化趋势。因此,将时间序列应用小波包分解为三层,然后对每个小波包系数进行重构,对重构后的系数分别建立相应的支持向量机回归模型,最后对所预测的数据直接相加便是合成预测值,预测的均方误差MSE=0.0021,相关系数R=99.0127%,它不仅预测精度更高,而且很好地反映了数据的局部变化趋势。两种方法的对比结果如图6、表5所示,其中小波包采用DB20,分解层数为3层。其余特征参量可以用同样的方法分别建立各自的预测模型。

5 故障映射模型的建立

为了实现液压泵的故障预测,需要对液压泵的振动信号进行实时监测。在实验中,每分钟对液压泵的振动信号进行一次采样,每次采样800个点,采样频率为2kHz,每小时就可以得到60组振动信号,以两个小时作为一个时间点,从120组振动信号中提取120组特征参量,并求其平均值,将结果作为液压泵的历史数据,对液压泵进行故障预测。

建立支持向量机故障映射模型,输入是10维的特征向量,输出是正常为0,1个柱塞松靴故障为1,2个柱塞松靴故障为2,斜盘磨损故障为3。选用径向基函数k(x,y)=exp(σ2(x-y)2)作为故障映射模型的核函数,参数C=100,G=0.1。

对于渐变性故障而言,存在潜在故障期,当模型的输出值大于0.9时,判定为该故障已经发生。提取出现松靴故障的前100个时间点的历史数据,将其中的前95个时间点的数据作为训练样本,后5个时间点的数据作为验证样本,此处只给出了最后5个点的数据(表6),预测结果如表7所示,预测结果与实际情况相一致,验证了该方法可以有效地对液压泵故障进行预测。

6 结语

通过采集液压泵正常及故障状态下的振动信号,利用EEMD和能量算子解调的方法对振动信号进行了包络解调,应用小波包分析方法提取了故障预测的特征向量,建立了小波包理论和支持向量机相结合的预测模型,实例验证表明所建立的模型能有效地对液压泵进行故障预测。

参考文献

[1]刘思远.信息融合和贝叶斯网络集成的故障诊断理论方法及实验研究[D].秦皇岛:燕山大学,2010.

[2]吴虎胜,吕建新,吴庐山,等.基于EMD和SVM的柴油机气阀机构故障诊断[J].中国机械工程,2010,21(22):2710-2713.Wu Husheng,LüJianxin,Wu Lushan,et al.FaultDiagnosis for Diesel Valve Train Based on SVM andEMD[J].China Mechanical Engineering,2010,21(22):2710-2713.

[3]王翔,王仲生.基于改进Hilbert-Huang变换的转子碰摩故障诊断[J].中国机械工程,2011,22(24):2937-2940.Wang Xiang,Wang Zhongsheng.Incipient Rub-impact Fault Diagnosis of Rotor System Using Im-proved HHT[J].China Mechanical Engineering,2011,22(24):2937-2940.

[4]梁旭,李行善,张磊,等.支持视情维修的故障预测技术研究[J].测控技术,2007,26(6):5-8.Liang Xu,Li Xingshan,Zhang Lei,et al.Survey ofFault Prognostics Supporting Condition Based Ma-intenance[J].Measurement&Control Technology,2007,26(6):5-8.

[5]胡良谋,曹克强,王文栋,等.基于SVR的非线性系统故障诊断研究[J].机械科学与技术,2010,29(2):225-228.Hu Liangmou,Cao Keqiang,Wang Wendong,et al.Fault Diagnosis of Nonlinear Systems Based onSupport Vector Regression[J].Mechanical Scienceand Technology for Aerospace Engineering,2010,29(2):225-228.

[6]林近山.基于EEMD和Hilbert变换的齿轮箱故障诊断[J].机械传动,2010,34(5):62-65.Lin Jinshan.Gearbox Fault Diagnosis Based on EE-MD and Hilbert Transform[J].Journal of Mechani-cal Transmission,2010,34(5):62-65.

[7]鞠平华,秦树人,赵玲.基于LMD的能量算子解调方法及其在故障特征信号提取中的应用[J].振动与冲击,2011,30(2):1-4.Ju Pinghua,Qin Shuren,Zhao Ling.Energy OperatorDemodulating Approach Based on LMD and Its Appli-cation in Extracting Characteristics of a Fault Signal[J].Journal of Vibration and Shock,2011,30(2):1-4.

[8]盛兆顺,尹琦岭.设备状态监测与故障诊断技术及应用[M].北京:化学工业出版社,2004.

[9]王冬云,张文志,张建刚.小波包能量谱在滚动轴承故障诊断中的应用[J].轴承,2010(11):32-36.Wang Dongyun,Zhang Wenzhi,Zhang Jiangang.Application of Wavelet Packet Energy Spectrum inRolling Bearing Fault Diagnosis[J].Bearing,2010(11):32-36.

[10]Chen Bojun,Chang Mingwei,Lin Chijin.LoadForecasting Using Support Vector Machines[J].IEEE Transactions on Power Systems,2004,19(4):1821-1830.

[11]吉训生.基于偏最小二乘支持向量机的短期电力负荷预测方法研究[J].电力系统保护与控制,2010,38(23):55-59.Ji Xunsheng.Short-term Power Load Forecastingon Partial Least Square Support Vector Machine[J].Power System Protection and Contorl,2010,38(23):55-59.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【集合经验模式分解】相关文章:

大庆模式枫桥经验发言01-07

集合票据05-04

教案集合范文05-18

集合教案范文05-18

简历模板集合08-19

作文素材集合12-13

高考集合考点分析10-23

集合问题解题策略05-13

产品合同模板集合05-15

投资求职试题集合05-24

上一篇:初中随笔训练作文教学下一篇:整理目标

精品范文