混合网络模型范文

2024-05-21

混合网络模型范文(精选10篇)

混合网络模型 第1篇

基于机器学习的用户行为建模始终是入侵检测领域 (IDS) 的一个重要课题[2]。Vapnik等人根据统计学习理论提出的支持向量机 (SVM) 已经吸引了许多人对该主题的关注。SVM是基于结构风险最小化 (SRM) 原则, 尽量提高学习机的泛化能力, 它的局部最优解也一定是全局最优解。将SVM应用到入侵检测系统中, 可避免基于传统机器学习检测方法的局限性, 能保证在不降低检测精度的条件下, 满足实时检测需求, 使整个入侵检测系统具有较好的检测性能[3]。本文将支持向量机应用于入侵检测更宽广的范围, 提出了一种基于SVM的, 将滥用检测和异常检测相结合的新型入侵检测模型, 并将这种模型应用于实际网络连接信息数据中的不同类攻击的检测试验, 可以达到增加检测正确率, 自适应升级入侵检测特征库的目的。

本文其余部分的组织如下:第二节简单讨论了SVM及其应用于入侵检测的可行性;第三节具体描述了将滥用检测和异常检测相结合的新型入侵检测模型;第四节介绍了仿真实验环境及数据源, 并给出实验结果;最后一节给出结论和下一步工作的展望。

1 SVM与入侵检测

从本质上讲, 入侵检测实际上是一个分类问题, 就是要通过检测把正常数据和异常数据分开, 属于模式识别和分类的范畴。支持向量机方法作为模式识别中的一种新的学习和分类方法, 必然可以在入侵检测领域中找到其应用领域[4]。

SVM的主要思想是, 对于一个给定的具有有限数量训练样本的学习任务, 通过在原空间或经投影后的高维空间中构造最佳超平面, 将给定的属于两个类别的训练样本分开。

在某区域里, 给定m个所属训练样本集类,

其中x为k维向量, yi为向量xi的类别标识。若超平面

能将样本分为两类, 其中为向量的点乘积, 对所有的样本xi而言, 到最佳超平面的最小距离为:|+b|/‖w‖, 其中式|+b|其样本的最小值为1, 则最佳超平面的边界最小值为

要使两类样本到超平面的最小距离之和最大, 即等效于最小化‖w‖, 此优化问题转化为目标函数:Minimize

利用Lagrange乘子法, 即

αi为Lagrange乘子项, 且αi≥0。式 (3) 即变成其对偶形式:

可求得另一个参数b满足:

对于未知样本类的向量x, 引入线性判决函数:f (x) =sgn (+b) 来确定其属类。

综合式 (6) 可得判决函数为:

最终判决函数为[5]:

2 基于SVM的混合入侵检测模型

2.1 入侵检测系统的CIDF模型

DARPA提出的CIDF模型定义了一个通用的入侵检测框架, 该框架把一个IDS分为四个组件:事件产生器 (Event Generators) 、事件分析器 (Event Analyzers) 、响应单元 (Response Units) 和事件数据库 (Event Databases) 。CIDF将IDS需要分析的数据统称为事件 (event) , 它既可以是网络中的数据包, 也可以是从系统日志等其他途径得到的信息。这四个组件在IDS中的位置和相互关系如图1所示。

2.2 新型入侵检测模型的组成及功能

在CIDF的基础上, 本文提出了一个基于SVM的, 将异常检测和滥用检测相结合的入侵检测模型。与CIDF通用模型相比, 在本文提出的模型中, 由SVM训练器, SVM检测器和支持向量数据库等部分构成模型的异常检测模块, 而由Snort[6]及其黑客攻击行为特征库构成模型的滥用检测模块, 模型结构如图2所示。

2.2.1 预处理模块

该模块主要由网络数据捕获模块和网络连接信息提取及处理模块构成。首先由网络数据捕获模块捕获网络中的数据流, 再由网络连接信息提取模块从得到的网络数据流中分析出网络连接记录, 并提取出每条网络连接的特征信息, 然后将特征信息进行数据预处理, 分别得到适合Snort规则和SVM分析的输入向量形式, 并输入相应模块。

2.2.2 异常检测模块

在该模块中, SVM训练子模块对预先选定的训练数据集进行训练, 训练数据集中的数据是从数据预处理模块中得到的。训练有两种方式, 一种是监督学习, 就是对训练数据集中的每条数据都给出其类别信息, 即训练样本是由 (x, y) 成对给出;另一种是非监督学习, 就是训练数据集中的每条数据不给出其类别信息。经训练之后将得到一组支持向量并存入SVM支持向量库, 这组支持向量也就是训练后得到的模型。

SVM检测子模块是整个系统最重要的部分, 是入侵检测的核心部分。它利用SVM训练模块得到的SVM支持向量组对实际需要检测的网络连接记录 (这些记录也是从数据预处理模块中得到的) 进行预测, 预测的结果即输出值为1或-1 (1表示正常, 即未发生入侵行为;-1表示异常, 即发生了入侵行为) 。

SVM支持向量库用于存放SVM训练模块训练后得到的支持向量组, 为了存取方便, 使用数据库形式。

2.2.3 滥用检测模块

主要利用成熟的滥用检测入侵检测系统Snort的机制, 通过一种简单、轻量级的规则描述语言来制定出一系列的规则, 然后将侦听到的数据包经处理后与现有规则集进行匹配, 根据匹配的结果来判别是否有入侵行为的出现。

2.3 混合入侵检测的步骤及输出判别策略

1) 首先预处理模块通过嗅探器 (如tcpdump) 截获并存储网络数据包, 并进行简单的协议分析, 再通过连接信息提取模块将该连接的特征信息提取出来 (网络连接的数据特征有41项) , 并且由预处理模块将这些特征相关性进行处理, 分别得到适合SVM处理的向量形式和适合Snort规则的特征形式;

2) 异常检测和滥用检测模块分别得到经预处理模块输入的数据。滥用检测模块利用已知特征库, 采用特征匹配的方法确定攻击事件, 并输出判决结果Y1, 异常检测模块利用SVM分类器对输入进行分类, 来确定有无入侵事件的发生, 并输出判决结果Y2;

3) Y1和Y2 (0代表正常, 1代表入侵) 同时输入到判决单元模块, 在该模块中按照如下原则进行判决:a) 如果Y1为0, Y2也为0, 则系统总的输出Y为0;b) 如果Y1为1, Y2也为1, 则系统总的输出Y为1;c) 如果Y1为1, Y2为0, 则系统总的输出Y为1;

4) 如果输出为a) 和b) 两种情况, 系统将不再进行下一步处理;如果输出为c) 类情况, 则系统再将该次的入侵输入特征与已知特征库中的特征条目一一计算距离 (采用基于异构数据集的HVDM距离) , 将该次入侵并入与其距离最小的特征条目中, 这样当此类攻击再次发生时, 可以直接由滥用检测模块识别出来, 提高了检测效率。

3 仿真实验及结果

3.1 数据源及实验环境

可用于网络入侵检测的数据源有很多, 本文选用的是MIT林肯实验室提供的KDDCUP99[7]数据, 整个数据收集过程是在一个模拟的网络环境中进行的, 该环境模拟了一个典型的美国空军局域网, 并且在该环境中掺入了多种网络攻击。这批数据中包含7个星期的网络流量, 大约有500万条连接记录, 其中有大量的正常网络流量和各种攻击, 具有很强的代表性。主要共有4类攻击:DoS:拒绝服务攻击, 如SYN Flood, land攻击;R2L:远程权限获取, 如:口令猜测;U2R:各种权限提升, 如各种Buffer Overflow;Probe:各种端口扫描和漏洞扫描。由于源数据过于庞大, 在此实验中, 我们采取等间隔选取数据的方法, 选取KDDCUP的10percent数据源进行实验。

在本实验中, 我们选用New Zealand的the University of Waikato提供的开源仿真软件WEKA3.5[8]的SVM环境, 并且加入新提出的LS-SVM[9]算法, 采用RBF型核函数, 仿真结果显示取得了不错的入侵检测效果。

3.2 实验结果及分析

实验主要在总的检测精度、误报率、训练时间、检测时间等几方面, 对原始滥用检测系统、原始异常检测系统和本文提出的基于SVM的混合检测系统进行比较, 主要结果如表1。

通过对比, 我们发现:

1) 异常检测比滥用检测有较高的检测精度和检测率, 但是由于核函数的选择及参数训练的误差, 导致检测时误报率较高, 而滥用检测是利用已有的特征库进行匹配, 误报率小得多。

2) 基于SVM的混合检测模型集中了异常检测和滥用检测的优点, 在检测精度, 检测率及误报率等指标都优于另外两种模型, 但训练时间较长。

4 结论及下一步工作

通过理论分析和对网络连接数据的实验验证, 表明本文提出的基于SVM的混合入侵检测模型具有较高的检测性能和较快的检测速度, 所得到的结果令人满意, 下一步应该将研究重点放在SVM核函数的选择及参数优化方面, 相信解决了上述问题之后, 本文提出的模型能够表现出更好的性能。

参考文献

[1]卿斯汉.入侵检测技术研究综述[J].通信学报, 2004, 25 (7) :19-29.

[2]Vapnik VN.The Nature of Statistical Learning Theory.New York:Spring-Verlag, 1995.

[3]饶鲜, 董春曦, 杨绍全.基于支持向量机的入侵检测系统[J].软件学报, 2003, 14 (4) :798-803.

[4]Mukkamala S, Janoski G, Sung A H.Intrusion Detection Using Neural Networks and Support Vector Machines[J].Proceedings of IEEE International Joint Conference on Neural Networks, 2002:1702-1707.

[5]印鉴, 张钢, 陈忆群, 等.Multi-events Analysis for Anomaly Intrusion Detection.International Conference of Machine Learning and Cyber-netics, 2004.

[6]http://www.snort.org

[7]KDDCUP99:http://kdd.ics.uci.edu/databases/kddcup99

[8]http://www.cs.waikato.ac.nz/~ml/weka

混合网络模型 第2篇

关键词: 眼部特征; 混合参数模型; 语义编码

中图分类号: TP 391.9文献标志码: Adoi: 10.3969/j.issn.10055630.2014.06.014

引言眼部语义特征[13]提取在如机器视觉、人脸识别、人机交互界面中占有重要的地位。常用的眼部特征提取方法[47]有基于可变形模板法[8]、基于三庭五眼法、模板与投影相结合法、基于几何特征检测等。在基于可变形模板法[910]中眼睛的几何模板中需要对几何模型设置初始化参数,即便是在改进的可变形模板中也需要通过先验知识设置相应的初始化参数,虽能够实现对眼睛特征的提取,但计算复杂度较高、比较耗时。模板与投影相结合法是在图像搜索区域内将模板遍历搜索区域,根据相关匹配数值检测出眼睛特征值。基于几何特征的人脸检测方法是依据人脸当中依据五官的位置划分不同的区域,然后提取相应的特征。以上方法大多是对眼睛或眉毛[11]单独进行几何模型特征提取,没有把眉毛与眼睛作为一个整体系统进行建模。由于眉毛与眼睛在面部的几何位置,往往依据对眼部特征几何形状的视觉感知,把眉毛与眼睛放在一起进行描述,虽然描述清晰但是存在差异没有量化,譬如三角眼不同的人对其感觉会有所不同。因此需要用相应的现代技术手段对其用标准予以界定,用参照标准描述人眼特征显得尤为重要。1描述眼部特征的方法

1.1构建眼部特征混合参数模型传统文化对眼部特征的汉语语义描述往往就是针对眼睛的特点,用许多形象、简洁的汉语语义来描述眼睛的特征,譬如细长眼、眯缝眼、三角眉、八字眉等,细长眼就是眼睛的垂直方向距离占眼睛内外角点距离的比例,当比例比较小时表现出来的细长的视觉特性。因此结合现有的眼部特征提取的方法,依据传统文化对眼部特征的语义描述,采用眉毛与眼睛相结合构建新型描述眼部特征混合参数模型,模型如图1所示。在图1所示混合参数模型中主要阐述三个方面的语义主特征:第一,描述眼睛的主特征,譬如特征参数N1描述眼睛间距,N2描述两只眼睛的眼心距,N5描述的是虹膜在眼睛里水平方向占的比例,表示眼睛中眼白的多少;第二,描述眉毛的语义特征,譬如特征参数N7描述眉毛的粗细程度,N8描述眉毛之间的距离;第三,描述眼睛与眉毛之间的语义特征,特征参数N11描述眉毛与眼睛之间的距离,N12与N13描述的是以眼睛为参照物,判断眉毛是内侧或者外侧型。 表征眼睛主特征参数如:N1=EX3/EX1;N2=EX2/EX1;N3=EX4/EX1;N4=EY1/EX4;N5=2·IR1/EX1;N6=IX1/EX1;表征眉毛主特征参数如:N7=BY1/BY2;N8=EBX1/EX4;N9=(B1(y1)-B3(y3))/(B1(x1)-B3(x3));N10=BX3/BX1;表征眼与眉毛之间主特征参数:N1=EBY1/EBY2;N2=EBX1/EX4;N3=EBX2/EX4;N4=EBX3/EX4;光学仪器第36卷

第6期刘祥楼,等:基于语义新型眼部特征的混合参数模型构建

1.2提取描述眼部特征的混合参数混合参数模型的特征参数的提取主要原理:首先,依据眼睛的色度信息定位眼睛;其次,依据眉毛与眼睛的几何位置关系分割出眉毛;最后,采用投影法提取相应特征参数。眼睛特征的提取主要是利用肤色的聚类特征检测出彩色图像中人的脸部,然后根据眼睛的色度信息提取眼睛轮廓。眼睛特征提取系统主要分为四个环节,即图像获取、人脸定位、区域分割、特征提取。具体过程如下(1)肤色区域的中值分别用Cb(Y)和Cr(Y)表示,变换式为:Ci(Y)=A2实验仿真与结果分析仿真实验计算机配置为AMD Athlon X2台式机,2.81 GHz主频,2.0 GB内存,计算机运行系统为Windows XP Professional SP3。在MATLAB软件平台上,本文采用东北石油大学2011级研究生入学采集的1 000张照片作为实验样本,实验的流程结构框图如图2所示。在提取眼部混合参数模型特征参数时,以语义字段的形式进行编码,如表1所示。每个混合特征参数针对实验过程中采集的数据的均值划分出4段阈值,并对阈值分别编码为00、01、10、11,如表2所示。图3所示是实验过程中输出的图像,可以看到检测出来眼睛与眉毛的边缘信息。图3中眼睛、眉毛图像投影分别如图4和图5所示。通过投影可以测得眼睛、眉毛特征中的特征参数,如眼心距、眉毛间距离等。也可以测得眉毛、眼睛角点的坐标,通过坐标值可以计算不能直接用投影直接提取的特征参数。例如B1点与B3点之间连线的水平夹角,可以通过投影测得其坐标值,利用坐标值测得N9数值,当N9>0表示眉毛下倾,N9在0附近表示眉毛两侧角点水平,N9<0表示眉毛上扬。提取虹膜的图像如图6所示,虹膜外边缘的投影图像如图7所示,可以测得描述虹膜的特征参数。

参考文献:

[1]周晓彦.基于偏最小二乘回归的人脸身份和表情同步识别方法[J].中国图象图形学报,2009,14(5):802808.

[2]TOLBA A S,ELBAZA H,ELHARBY A A.Face recognition:A literature review[J].International Journal of Signal Processing,2005,2(2):88103.

[3]ZHENG W,ZHOU X,ZOU C,et al.Facial expression recognition using kernel canonical correlation analysis(KCCA)[J].IEEE Transactions on Neural Networks,2006,17(1):233238.

[4]朱树先,张仁杰,郑刚.基于RBF神经网络的人脸识别[J].光学仪器,2008,30(2):3133.

[5]李峰,曾超,徐向东.驾驶防瞌睡装置中人眼快速定位方法研究[J].光学仪器,2002,24(4/5):7072.

[6]连华,林斌,汪林峰.虹膜图像采集系统的设计[J].光学仪器,2003,25(5):2430.

[7]沈沉,林斌,汪林峰.虹膜识别技术中的图像处理[J].光学仪器,2004,26(1):4448.

[8]谭华春,章毓晋,李睿.基于角点特征的眼睛轮廓提取[J].中国图象图形学报,2007,12(7):12251229.

[9]李文书,何芳芳,钱沄涛,等.基于Adaboost高斯过程分类的人脸表情识别[J].浙江大学学报,2012,46(1):7983.

[10]王宇博,艾海舟,武勃,等.人脸表情的实时分类[J].计算机辅助设计与图形学学报,2005,17(6):12961301.

混合网络模型 第3篇

近年来的统计数据显示,我国的煤矿安全形势趋于好转,但是和西方发达国家相比却依旧严峻,重特大事故虽有所减少却伤亡惨重,煤矿安全管理工作仍需加强。分析和预测我国煤矿事故死亡人数的变化趋势,对明确事故规律,做好安全防范、安全预警具有重要的意义。

煤矿是一个庞大而复杂的系统,煤矿死亡人数受多因素的影响而表现出很强的非线性、非稳定特性,用单一的线性或非线性模型难以准确预测[1]。为了有效地利用各种模型的优点,Bates[2]提出了组合预测的思想,通过适当方式对预测模型进行组合可以达到更优预测结果。在这方面,胡双启等[3,4]将灰色预测模型GM (1,1)与Elman神经网络预测模型相结合,建立了火灾、煤矿事故预测模型,得到了很好的预测结果但建模过程较复杂;程爱宝等[5]、陈娇等[6]分别利用AHP与粗糙集理论相结合、突变理论与模糊数学理论相结合的方法对矿山采空区稳定性进行评价和量化运算,所得结果更为合理与科学,为矿山采空区稳定性研究提供一种新方法。

考虑到指数平滑法在跟踪数据发展趋势上的简单易操作和BP神经网络对非线性模拟预测的优势,本文选取我国1991~2010年煤矿死亡人数(见表1)作为原始数据,分别用指数平滑法和BP神经网络建模预测,在对比分析两种模型预测结果后,进一步采用指数平滑-BP神经网络混合模型进行预测和分析。综合评价不同模型预测结果,确定最佳的煤矿死亡人数预测模型,并应用该模型对2014年及其未来五年的煤矿死亡人数进行预测,以期对未来的煤矿安全生产工作起到积极的指导作用。

注:数据来源于中国安全生产年鉴(2000~2009)和相关文献[7]。

1 单一模型预测

1.1 指数平滑模型(EWMA)

指数平滑法的原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均[7]。当时间序列呈现出非线性趋势变化时,一般采用三次指数平滑法预测,预测模型为:

其中,T为第t期到预测期的间隔期数;at,6t,ct为三次指数平滑法的预测参数。

设一列时间序列Xt={x1,x2,…,xt},采用三次指数平滑法预测,平滑值计算公式为:

式中,为第t期i次指数平滑值;α为平滑系数,α∈[0,1];当i=1时,式中。

本文以三次指数平滑法建模分析,利用常用的EXCEL及其“规划求解”功能,以实际值和预测值的均方误差为评价指标确定全局的最优平滑系数为α=0.2592。预测结果与实际值的对比见图1。

1.2 误差反传神经网络模型(BP-ANN)

误差反传神经网络是Rumelhant和McClelland于1986年共同提出的一种多层网络“模式顺传、误差逆传”[8]算法。BP神经网络由输入层、一层或多层中间层(隐含层)、输出层构成,隐含层是过渡层。在输入层输入原始数据,之后进入隐含层,通过对数据的整合处理到达输出层,将信息输出。由于BP网络良好的学习功能,通过误差的反向传播,对样本进行反复训练调整权重,使误差最小,因此BP网络应用最为广泛。

在应用BP神经网络进行数据预测时,首先是确定网络的结构。隐含层神经元个数N的设计非常重要,目前还没数学理论支撑,一般利用以下经验公式确定:

式中,m、n分别为输入神经元数和输出神经元数;a为1~10之间的常数。

在本实例的预测中,从简单网络开始,逐步增加隐含层神经元个数直至合适为止。以MATLAB7.14为计算平台,建立一个3-N-1的前向BP神经网络。输入层和隐含层采用的激活函数为正切Sigmod型传递函数“tansig”,输出层激活函数为“logsig”,网络训练选择梯度下降动量和自适应学习速率算法“traingdx”。将总样本分为两部分:前17组数据为训练样本,后3组数据为检验样本。图2为不同数目隐含层神经元的BP网络预测结果(N=5、7、9、10)。

1.3预测结果对比分析

图1中的表给出了预测值的相对误差范围、平均相对误差、均方误差。从图1中可以看出三次指数平滑法可以很好地跟踪时序的发展,显现原始数据的非线性变化趋势,但是这种趋势的跟踪存在明显的延迟。由于预测延迟、原始数据的“线性”下降,使得相对误差高达-47.94%,但该法对于修匀数据具有很实用的价值。图2给出了不同数目隐含层神经元(N=5、7、9、10)的BP网络预测结果。从图中可以得出,该组BP网络都具有很好的数据拟合效果,而网络的泛化能力[9]差,对于检验样本的预测存在较大的偏差,根本原因在于传递函数的值域受限且传递函数各段变化趋势不一致[10]。预测过程表明确定一个具有良好预测能力的神经网络往往需要反复地尝试不同的网络结构计算和不断地调整网络权值,这对快速准确地预测无疑是一个棘手的问题。

2 混合模型预测

2.1 EWMA-BP混合模型预测原理与实例

设原始时间序列为Xt,指数平滑模型预测出的时间序列为Lt,则:

其中,时间序列et是指数平滑模型预测的残差,具有很强的非线性特性。指数平滑-BP神经网络混合模型具体来说是先用指数平滑模型对时间序列进行预测,提取出时间序列中的主部Lt,再对预测的残差et进行神经网络建模,并用前期残差来预测当前的残差,得到残差的预测值,则修正后的预测值为:

即为指数平滑-BP神经网络混合模型的最终结果。

以三次指数平滑法提取原始数据的非线性主部Lt,之后对残差et建立BP神经网络模型,用前期残差来预测当前的残差,得到残差的预测值,具体网络结构类比前一节单一神经网络模型设定。经过调整网络权值得到最佳的残差预测值,并与指数平滑法的预测结果求和得出混合模型的最终预测结果,预测结果见图3。

2.2 不同模型预测结果比较

图4是指数平滑法、BP神将网络模型、指数平滑-BP神经网络混合模型的预测结果与实际值的对比图。从图中可以清晰的看到,指数平滑法的预测曲线明显滞后,和实际曲线吻合较差;BP神经网络模型的预测值出现沿着历史数据平滑发展的趋势,不具有良好的网络外推性;而指数平滑-BP神经网络混合模型的预测结果明显要优于前两者,在跟踪原始数据发展趋势的同时,还具有很强的外推性,此外混合模型的预测精度也很高,预测曲线与实际曲线有较高的吻合度。这是因为在用指数平滑法提取出原始序列的线性部分后,得到非线性特性更显著地残差序列,而这恰符合BP神经网络适用于非线性数据预测的特性,剔除了线性部分对整体数据造成的平滑趋势外推的影响。

分别计算三种预测方法的误差列于表2。从表中可以看出,指数平滑-BP神经网络混合模型的最大相对误差、平均相对误差、均方误差都是最小的,也即在误差最小原则下有最好的预测精度,适用于煤矿死亡人数的预测。

2.3 EWMA-BP预测与分析

指数平滑-BP神经网络混合模型对2014~2018年的煤矿死亡人数进行预测,结果见图5。

从图5中可以看出,尽管预测数据有一定的波动,但未来五年的煤矿死亡人数整体依旧呈现下降趋势,这与对2014~2018年死亡人数预测值的拟合情况是相符的。近年来国内重视煤矿安全生产是引起煤矿死亡人数持续下降的根本原因,其产生的巨大安全效益将逐步随时间延伸。此外,死亡人数下降速率正逐渐减缓直至趋于零,使得死亡人数较长时间地维持在较低水平,进一步的降低煤矿死亡人数必须依赖于煤炭安全生产技术或管理技术的革新,这也是未来我国煤炭安全生产的重要方向。

3 结论

本文在对比分析了指数平滑法与BP神经网络在煤矿死亡人数预测上的优劣,进一步采用指数平滑-BP神经网络模型,结合两种模型的优势,得到了良好的预测效果,并得出如下结论:

1)指数平滑法在预测有趋势的数据时存在明显的滞后,但可以跟踪其发展趋势;BP神经网络在以未训练的新数据为网络输入时,易导致预测值沿着历史数据平滑发展,不具良好的网络外推性。

2)利用指数平滑法提取非线性主部,并对残差建立BP神经网络模型的混合预测方法更加适用于对煤矿死亡人数的预测。

3)指数平滑-BP神经网络混合模型的预测结果表明,我国未来五年的煤矿死亡人数将表现为小幅波动下降,进一步的降低煤矿死亡人数必须依赖于煤炭安全生产技术或管理技术的革新。

参考文献

[1]孙玉亮,梁明,王胜康.基于spss时间序列模型的煤矿百万吨死亡率的预测[J].煤炭技术,2011,(8):3-5SUN Yu-liang,LIANG Ming,WANG Sheng-kang.Based on time series model of SPSS coal million tons mortality rates forecasts[J].Coal Technology,2011,(8):3-5

[2]Bates J M,Granger CWJ.The combination of forecasts[J].Operations Research Quarterly,1969,20(1):451-468

[3]李勇,胡双启.灰色Elman神经网络在火灾事故预测中的应用研究[J].中国安全科学学报,2009,19(3):28-31LI Yong,HU Shuang-qi.The application study of gray elman neural networks to fire accident prediction[J].China Safety Science Journal,2009,19(3):28-31

[4]胡双启,李勇.基于灰色Elman神经网络的煤矿事故预测[J].中国安全生产科学技术,2009,5(4):106-109HU Shuang-qi,LI Yong.Prediction of coal mine accidents based on gray elman neural networks[J],Journal of Safety Science and Technology,2009,5(4):106-109

[5]程爱宝,古德生,刘洪强.基于AHP与粗糙集理论的采空区稳定性影响因素权重分析[J].中国安全生产科学技术,2011,7(9):50-55CHENG Ai-bao,GU De-sheng,LIU Hong-qiang.Weights analysis of factors affecting the stability of Mined-out areas based on analytic hierarchy process and rough sets theory[J].Journal of Safety Science and Technology,2011,7(9):50-55

[6]陈娇,罗周全,侯造水.基于改进突变级数法的金属矿采空区稳定性评价[J].中国安全生产科学技术,2013,9(11):17-24CHEN Jiao,LUO Zhou-quan,HOU Zao-shui.Stability evaluation of metal mine goaf based on improved catastrophe progression method[J].Journal of Safety Science and Technology,2013,9(11):17-24

[7]朱庆明,张浩.三次指数平滑法在煤矿事故预测中的应用研究[J].中国安全生产科学技术,2012,(4):103-106ZHU Qing-ming,ZHANG Hao.Study on the application of cubic exponential smoothing method in coal mine accidents forecasting[J].Journal of Safety Science and Technology,2012,(4):103-106

[8]马科伟,袁梅,李波波,等.基于人工神经网络的煤矿安全事故预测研究[J].中国煤炭,2010,(9):109-112MA Ke-wei,YUAN Mei,LI Bo-bo,et al.A research on coal mine safety forecast model based on artificial neural networks[J].China Coal,2010,(9):109-112

[9]黄琳,魏保立.BP网络的泛化能力改进方法及应用[J].石家庄铁道学院学报,2005,(3):94-96HUANG Lin,WEI Bao-li.The improvement and application of BP network generalization ability[J].Journal of Shijiazhuang Railway Institute,2005,(3):94-96

混合网络模型 第4篇

关键词: 红外图像; 降噪; 非下采样Contourlet变换; 拉普拉斯分布

中图分类号: TP391.41文献标识码: A文章编号: 1673-5048(2016)05-0066-05

Abstract: For the denoising problem of infrared image, an algorithm is proposed based on mixed statistical model of transform coefficients in nonsubsampled Contourlet domain. The image is transformed into nonsubsampled Contourlet domain, and noise coefficients and signal coefficients are modeled respectively by Gaussian distribution and generalized Laplacian distribution. By using maximum a posteriori estimation theory under Bayesian framework, a new estimation formula for the original signal coefficients is deduced, and the noise image coefficients are processed to realize the infrared image denoising of nonsubsampled Contourlet domain. The experimental results show that the proposed method can suppress the Gaussian noise effectively and keep most of the images detail information, which has higher value of peak signal noise ratio and better visual effect than some standard algorithms.

Key words: infrared image; denoising; nonsubsampled Contourlet transform; Laplacian distribution

0引言

红外图像噪声丰富, 而噪声造成图像退化、 图像特征被掩盖, 直接影响图像分割、 特征提取等后续工作的准确性, 因此, 抑制红外图像噪声、 提升图像质量是红外成像应用中图像处理和分析的前提。

小波变换具有良好的时频局域化特性和多分辨率特性[1], 在图像降噪中得到了广泛的应用[2-5]。 小波变换在表示具有点奇异性的函数时是最优基, 但是对于更高维的特征则显得力不从心。 在二维图像中, 边缘、 轮廓和纹理等具有高维奇异性的几何特征包含了大部分信息, 对此, 小波不是表示图像的最优基。

Do等人提出的Contourlet变换是一种真正的图像二维表示方法, 其将小波的优点延伸到高维空间, 能够更好地刻画高维信息的特性, 更适合处理具有超平面奇异性的信息[6-7]。 但是, Contourlet变换不具备平移不变性, 在利用其进行图像去噪时, 奇异点周围会引入伪吉布斯(Gibbs)现象。 此外, Contourlet变换存在下采样过程, 因此低频子带和高频子带均存在频谱混叠现象。 频谱混叠造成同一方向的信息会在几个不同方向子带中同时出现, 这在一定程度上削弱了其方向选择性。

Cunha等人[8-9]利用非下采样塔式分解和非下采样滤波器组构造出了非下采样Contourlet变换(Nonsubsampled Contourlet Transform, NSCT), 具有平移不变性。 NSCT继承了Contourlet变换的良好特性, 变换后系数能量更加集中, 能够更好地捕捉和跟踪图像中重要的几何特征。 同时, 由于没有采样过程, 图像的分解和重构过程中不具有频率混叠项, 这使得NSCT具有平移不变性。

在图像降噪中应用Contourlet和NSCT, 最常用的是传统的阈值方法[10-14]。 该类方法的缺点在于没有考虑到各图像尺度内系数的相关性、 相邻尺度系数之间的相关性以及边缘轮廓的关系, 图像细节信息不能很好地保留且存在振铃现象。 建立变换系数尺度内和尺度间的统计模型是在变换域还原信号系数、 抑制噪声系数的关键问题[15]。

红外成像应用中的红外探测器是系统噪声的主要来源, 是影响红外图像质量的主要因素, 其强度一般情况下远大于其他环节产生的噪声, 同时也是最难以克服的。 探测器本身的噪声是无法避免的, 按照其产生的机理可分为散粒噪声、 热噪声、 光子噪声、 产生复合噪声和1/f噪声等。 其中散粒噪声、 热噪声、 光子噪声和产生复合噪声所产生的探测器电流输出是一个随机过程, 由中心极限定理近似服从高斯分布。 1/f噪声是红外探测器低频部分的一种电流噪声, 顾名思义, 1/f噪声与频率成反比, 当高于一定频率时, 与其他噪声相比可忽略不计。 因此, 可认为影响红外图像质量的噪声服从高斯分布[16]。

航空兵器2016年第5期刘刚等: 非下采样轮廓波域混合统计模型红外图像降噪方法基于以上分析, 在NSCT域提出了一种新降噪方法。

1NSCT域混合统计图像降噪模型

1.1NSCT理论

NSCT与Contourlet变换一样, 也是采用由拉普拉斯金字塔变换与方向滤波器组所构成的双迭代滤波器组结构。 但NSCT采用的是非下采样塔式滤波器和非下采样方向滤波器组, 变换时首先由非下采样塔式滤波器将图像分解为低通(低频)部分和带通(高频)部分, 然后由非下采样方向性滤波器组将带通部分分解为若干个方向。 NSCT去掉了塔式分解和方向性滤波器组分解中信号经分析滤波后的下采样(抽取)以及综合滤波前的上采样(插值), 而改为对相应的滤波器进行采样, 再对信号进行分析滤波和综合滤波。

1.2混合统计降噪模型

NSCT域信号系数尺度间和尺度内同方向子带内相关性强, 噪声系数层间相关性较弱、 层内无相关性。 基于此, 将NSCT系数分为噪声系数和信号系数两类并分别建模, 根据贝叶斯框架下的最大后验估计理论, 推导降噪方程。

信号系数包含了图像的大部分信息及主要的边缘和纹理, 相邻尺度间的系数相关性较强, 分解系数的统计分布在原点处的峰值更尖锐, 并具有长拖尾, 可采用广义的拉普拉斯分布来建模。 噪声系数主要是噪声和微小细节的贡献, 采用具有强局部相关的零均值高斯分布来建模。

从表1、 图1~3可得出如下结论:

(1) 从表1中可知, 基于NSCT域系数混合统计模型降噪算法的PSNR最高, 能有效去除图像中的高斯白噪声, 较好地保持图像的边缘, 在噪声强度较大时, 降噪能力更加明显;

(2) 从图1、 图2和图3可知, 基于NSCT域系数混合统计模型的降噪算法既滤除了图像噪声, 又有效地保持了相关边缘细节;

(3) 基于Contourlet域混合统计模型降噪算法在视觉效果上同NSCT域方法接近, 但在PSNR上比NSCT域方法稍差;

(4) 小波软阈值法在滤除噪声的同时造成了边缘细节的模糊;

(5) Contourlet阈值降噪方法边缘细节部分保持较好, 也能有效滤除噪声, 但是出现了较为明显的栅格效应。

4结论

在NSCT域对噪声系数、 信号系数分别按照高斯分布和广义拉普拉斯分布建模, 根据贝叶斯框架下的最大后验估计理论, 推导原始信号系数的估计公式, 对包含噪声的图像系数进行处理, 实现NSCT域红外图像降噪。 NSCT具有平移不变性和更好的方向选择特性, 实验结果充分表明了本文提出的基于NSCT域系数混合统计模型的降噪方法在PSNR提高与视觉效果上优于部分经典降噪方法。

参考文献:

[1] 高静, 李朝伟, 董云峰, 等.空空导弹导引头小波降噪参数优选仿真研究[J].航空兵器, 2010(5): 48-54.

[2] 徐小军, 王友仁. 基于离散分数阶正交小波变换图像降噪新方法[J].电子学报, 2014, 42(2): 280-287.

[3] 张田, 孙延奎, 田小林.二进小波与扩散滤波结合的光学相干层析图像降噪[J].吉林大学学报(工学版), 2013, 43(S1): 340-344.

[4] 金炜, 周亚训, 符冉迪, 等.采用零树结构分类小波系数的红外图像降噪[J].光电工程, 2012, 39(5): 79-83.

[5] Donoho D L. DeNoising by SoftThresholding[J]. IEEE Transactions on Information Theory, 1995, 41(3): 613-627.

[6] Po D DY, Do M N. Directional Multiscale Modeling of Images Using the Contourlet Transform[J].IEEE Transactions on Image Processing, 2006, 15(6): 1610-1620.

[7] Do M N, Vetterli M. The Contourlet Transform: An Efficient Directional Multiresolution Image Representation[J]. IEEE Transastions on Image Processing, 2005, 14(12): 2091-2106.

[8] Cunha A L, Zhou Jianping, Do M N. The Nonsubsampled Contourlet Transform: Theory, Design and Applications[J].IEEE Transactions on Image Processing, 2006, 15(10): 3089-3101.

[9] Zhou Jianping, Cunha A L, Do M N. Nonsubsampled Contourlet Transform: Construction and Application in Enhancement[C]∥Proceedings of the IEEE International Conference on Image Processing, 2005: 469-472.

[10] 戴维, 于盛林, 孙栓. 基于Contourlet变换自适应阈值的图像去噪算法[J].电子学报, 2007, 35(10): 1939-1943.

[11] 刘丽萍, 崔宁海, 王琰.一种新的Contourlet变换图像降噪算法[J].沈阳理工大学学报, 2012, 31(1): 31-35.

[12] 程光权, 成礼智.基于冗余Contourlet变换的图像相关法去噪[J].中国图象图形学报, 2008, 13(9): 1678-1682.

[13] 倪超, 李奇, 夏良正.基于非下采样Contourlet扩散滤波的红外图像降噪[J].东南大学学报(自然科学版), 2010, 40(S1): 272-276.

[14] 闫晟, 刘明刚, 原建平, 等. 一种基于NSCT变换的超声图像降噪新算法[J].仪器仪表学报, 2012, 33(5): 1005-1012.

[15] 王文, 芮国胜, 王晓东, 等.图像多尺度统计模型综述[J].中国图象图形学报, 2007, 12(6): 961-968.

混合网络模型 第5篇

无线传感器网络 (Wireless Sensor Networks, WSNs) 是近年来的热门研究领域之一。无线传感器网络自身的一些特点如能量有限、低功耗计算、无线通信等使它们面临许多安全威胁[1]。当攻击者位于网络的内部时, 作为第一道防线的防火墙是无效的。入侵检测系统 (Intrusion Detection System, IDS) 是第二道网络安全防线, 可以对来自内部和外部的攻击进行检测和预防。为有线网络和ad hoc网络设计的入侵检测系统不能直接用于无线传感器网络, 因此有必要为无线传感器网络设计一种特定的入侵检测系统, 并且要充分考虑到无线传感器网络自身的特点[2]。文章的组织如下:第一章介绍了相关研究工作。第二章提出了无线传感器网络的安全架构。第三章介绍了该IDS应对攻击的算法。第四章对该方案的性能进行分析。最后得出结论并对未来的工作进行展望。

1 相关研究

在相关文献中, 有一部分将异常检测技术和基于签名的检测技术结合起来以获得这两种检测技术的优点。文献[3]提出了一种基于簇的分层入侵检测系统, 在每个簇头 (Cluster-Head, CH) 中安装一个入侵检测代理。代理有三个模块:一个监督学习模块, 一个基于规则的异常检测模块和一个决策模块。仿真结果表明这种模型有较高的检出率和较低的误报率。然而这种方案的主要缺点是:入侵检测系统只运行在静态的簇头节点中, 如果入侵者集中力量攻破这个节点, 网络就会随之受到破坏。并且这种检测机制的实现需要在簇头节点进行大量的计算, 从而会减少网络的生存期。文献[4]基于Roman等人的模型为无线传感器网络提出了一种混合轻量级入侵检测系统。这种入侵检测方案利用基于簇的协议构建了一个分层网络, 并提出了一种基于异常模型和误用检测技术的入侵检测框架。在他们的方案中, 入侵检测代理由本地代理和全局代理两个检测模块组成。同一节点中的两个代理互相合作以达到更高的检测精度。然而这种方案的缺点是签名特征急剧增加, 可能导致节点内存过载。文献[5]提出了一种混合轻量级的分布式无线传感器网络入侵检测系统。该入侵检测系统采用了误用检测和异常检测相结合的方法。它由一个中央代理和若干本地代理组成, 中央代理利用数据挖掘技术进行高精度的入侵检测, 本地代理在远端进行轻量级异常检测。

基于以上这些混合模型, 文章提出了一种高效的轻量级无线传感器网络入侵检测系统。目标是实现一种结合了基于异常和基于签名模型优点的新型入侵检测模型, 该模型能够超越前面提到的几种混合模型。

2 混合模型结构

混合入侵检测系统 (Hybrid Intrusion Detection System, HIDS) 能够达到高检出率和低误报率这一目标[6]。该模型使用基于支持向量机 (Support Vector Machine, SVM) 的异常检测技术和一组由固定规则签名表示的攻击, 以验证该异常检测技术识别恶意行为的能力。该检测方法被集成到一个基于簇的拓扑中以延长网络生存期。这是通过选择一个已知节点作为族首, 由它将节点数据汇聚后传给基站 (Base Station, BS) 来实现的。簇头就像一个本地基站传感器, 在任何给定的时间, 每个节点都以一定的概率当选为簇头[7]。我们提出了一种基于簇的架构, 将传感器阵列分成多个组, 每个组包含一个簇头。在这种体系结构中, 每个节点只属于一个簇, 簇在整个网络中按地理位置分布。簇头的使用可以减少网络能量消耗, 提高网络生存期[8]。图1 显示了该混合型入侵检测系统的体系结构。

2.1 簇头选举与布局策略

簇头是根据节点的能量动态选出的。由基站宣布簇头的选举过程, 簇头通过公式Vi (t) =[Initial–Ei (t) ]/r来计算剩余能量, 其中Initial表示初始能量, Ei (t) 表示剩余能量, r是簇头选择的当前轮次[9]。基站根据得到的值计算平均值和平均偏差, 簇头向节点宣布选举的程序。老的簇头广播一条消息宣布权力的撤销, 新簇头向传感器节点发送警报消息。簇头负责对簇中的其他成员进行身份认证, 而基站负责对簇头进行认证[10]。由于电池寿命和资源有限, 每个代理都仅在被需要时激活。代理分为本地代理和全局代理。

本地代理:本地代理模块负责监控传感器节点发送和接收的信息[11]。节点将特定的恶意节点攻击行为存放在它的内部数据库中。当网络刚开始组织时, 传感器节点没有任何关于恶意节点的信息。无线传感器网络部署后, 签名数据库逐渐构建起来。恶意节点数据库中的条目被创建并被簇头传播到每个节点。

全局代理:全局代理监听它的邻居节点的通信。由于无线网络的广播特性, 每个节点可以接收到所有通过其无线电范围内的数据包。全局代理必须有它的邻居节点的信息来监视数据包。我们使用本地监测机制和预定义规则来监视数据包。如果监视节点发现其邻居节点中可能出现的安全漏洞, 它们就创建一个警报并发送到簇头。簇头收到警报后通过阈值判定其是否可疑节点。两种代理都建立在应用层。图2 描述了该入侵检测系统在网络中的部署情况。

2.2 基于支持向量机的异常检测

支持向量机是一种由Vapnik等人提出的机器学习算法, 它是一种基于小样本学习的分类器设计方法, 适用于小样本数据的分类。因此支持向量机算法适合对IDS中的高维数据进行分类, 数据是从物理层、MAC层和网络层收集的。收集到的训练数据使用一个数据简化过程进行预处理, 目的是减少它们的数据量以便于被SVM处理。接下来将训练数据矢量映射到高维空间并将问题转化为空间中的线性分类问题。映射过后, SVM找出一个具有最大间隔的线性分类超平面。

假设线性可分样本集为 (xi, yi) , 给定训练数据集:

i = 1, …, n, x∈Rd, y∈{+1, -1}, 在这里{1}表示正常, {-1}表示不正常。分类超平面方程是:

其中w是标准矢量, 参数b是偏移量。超平面上的训练样本被称为支持向量, 因为他们支持最优分类超平面。所以我们的问题用公式表述为:

服从于yi[ (w·xi) + b] - 1 ≥ 0 i = 1, 2, …, n分类函数可以如下描述:

最优分类函数可如下描述:

这是核心函数并且ai是拉格朗日乘子。根据Kuhn-Tucker条件, 与ai> 0 相对应的xi称作支持向量 (Support Vectors, SVs) 。在我们的上下文中, 每个节点与它的单跳邻居节点交流向量。这个过程完成后, 最终的超平面被计算出来, 所有节点使用相同的判别方法来将数据分为正常和异常两类。因此SVM方法适合将入侵检测系统中的高维数据进行分类。与神经网络方法相比, SVM方法用更少的训练时间得到了更好的结果。SVM的另一个优点是更低的泛化误差概率。

2.3 基于签名的模型

该模块使用一个基于签名的发现协议来检测恶意节点, 以防止网络被这些节点破坏。该协议的目的是在一组规则的基础上将目标的行为分成正常和异常两类。在这里对每种攻击有四条检测规则。检测选择性转发攻击的规则是通过丢弃的数据包的数量和存在超过阈值的节点来定义的。检测Hello泛洪攻击的规则是IDS代理接收到的信号的强度超过规定的阈值。检测黑洞攻击的规则是根据丢包的数量和信号强度过高。检测虫洞攻击的规则是信号强度超过阈值和没有任何相邻节点重传来自对方的数据包。

2.4 决策模型

在协同作业过程中, 簇头应用了一个简单规则机制。如果被异常检测技术检测到的攻击和预定义的攻击者签名之间没有对应关系, 入侵检测代理便向簇头发送一个报告, 然后采用一条快速规则来对可疑节点做出最后的判定。簇头向管理员汇报该结果以帮助他们管理网络并做出进一步的修正。最后簇首发送一条消息给所有的入侵检测系统, 于是它们便更新自己的签名库。图3 说明了决策模型中使用的规则。

3 混合检测模型的性能

在这一部分, 我们使用KDD99 数据集来评估该入侵检测模型的性能。我们研究当网络中IDS的数量增加时检出率和误报率的变化。最后将我们的模型与其它混合模型的性能进行比较。为了评价所提出模型的有效性, 采用了一组度量标准来进行判定。

·检出率:表示检测出的攻击数占总攻击数的比率。

·误报率:将正常连接误判为异常行为的比率。

基于SVM的异常检测与基于攻击签名的检测相结合的模型能够达到较高的检出率 (约98%) 和较低的误报率 (约3%) , 表1 显示了该模型对四种攻击行为的检出和误报情况。

为了检测所提方案的有效性, 我们将该模型与其他四位作者Bin[12], Khanum[13], Yuan[14]和Hai[4]提出的混合模型进行比较, 着重分析检出率和误报率。图4 显示了几种无线传感器网络入侵检测模型的性能比较。

通过图4 看出, 我们提出的混合模型在检出率和误报率方面比其它模型更有优势。

4 结论

混合网络模型 第6篇

在国内外采矿、化工和石油等工业行业,偶有发生工业灾害尤其是爆炸事故,造成的危害和影响也极大。尤其在我国,煤炭占一次能源构成的70% 左右,伴随煤炭开采生产,瓦斯和粉尘爆炸事故也时有发生,给当地经济和社会发展带来极坏影响。为有效防范此类爆炸事故的发生,国内外学者对此类事故的爆炸机理、爆炸威力、毁伤效应等开展了深入研究[1,2,3,4,5,6]。针对工业和军事领域的燃料空气混合物爆炸威力预测问题,国内学者探索研究了多种方法,但此类爆炸机理复杂、影响因素众多,目前的预测方法各有相应的限制条件[7]。本文基于人工神经网络原理,构建相应预测模型,开展燃料空气混合物爆炸威力预测研究。

1模型原理

人工神经网络属于人工智能范畴,适合用于处理分类、预测等影响因素复杂的一类问题。人工神经网络模型应用较广泛的是BP( Back Propagation) 模型,其典型结构如图1所示,单个神经单元构成如图2所示。

BP模型算法采用的是误差反向传播算法。

1) 学习信号前馈

式中: xi为图1输入层节点i的输入值,i = 1, 2,…n; zj为隐层节点j的输出值,j = 1,2,…q; yk为输出层节点k的输出值,k = 1,2,…m; wij、wjk分别为输入层与隐层、隐层与输出层节点的连接权值; θj为隐层节点的阈值; θk为输出层节点的阈值。

wij、wjk、θj、θk初始值为[- 1, + 1]区间的随机数。作用函数f采用sigmoid函数,即:

2) 误差信号反馈

式中: EP1为偏差; ykP1为第k个单元对应第P1个样本的输出值; TkP1为理想输出值。

总偏差为:

式中: E为总偏差; P为样本总数; m为输出单元总数。

式中: wst为图1任意两节点的连接权值; η 为步长。

当 ΔE = 0,模型将有一稳定解; 为防止此解为局部极值,引入动量因子 α :

式中,α 取值范围为( 0,1) 。

2模型设计

燃料空气混合物爆炸所形成的破坏作用,主要是通过大体积云雾爆轰及由此引起的空气冲击波实现的,对相关“软”目标毁伤效应严重。衡量燃料空气混合物爆炸威力大小,是一个比较复杂的问题,涉及爆炸源、爆炸形式等多个方面。针对燃料空气混合物爆炸威力预测问题,本文选取液态的环氧丙烷和固态的金属铝粉组成的液固混合燃料,引爆条件是小药量无约束空间。影响燃料空气混合物爆炸威力的因素较多,若使其它条件固定不变,则可选取图3所示的9个主要影响因素作为模型的输入层节点: 液态环氧丙烷质量百分含量CPO、固态金属铝粉质量百分含量CAl、混合燃料氧平衡OB、中心装药质量mc、比药量r、炸高h、环境温度T0、湿度H0、气压P0。

模型的输出层节点选取图3所示的反映混合物爆炸威力的5个考察指标: 爆压P、爆温T、爆热QV、 气体产物体积V、爆炸威力指数F。

式中: W为燃料质量、△P为云雾区超压、S为云雾覆盖面积、V为云雾体积、H为云雾高度、T为爆温。

对于给定的应用命题,若输入层节点数、输出层节点数、标准输入样本个数均已知,再确定隐层层数和每个隐层的节点数,则模型结构可定。本文标准输入样本选择表1所列的93组数据[8],输入层节点数为9,输出层节点数为5。根据相关研究成果,在设计变量不产生冗余时,模型隐层层数宜尽量取少, 通常取1 ~ 3层[9]。本文采用神经网络共轭梯度优化方法,通过间接优化计算,选定2个隐层,每个隐层5个节点。因此,本文设计的模型结构为( 9 - 5 - 5 - 5) ,如图3所示。

3模型训练及应用

对于多层神经网络,增加隐层数量虽能够提升网络的识别能力,但同时也使BP算法更易陷入局部极小值,采取预训练方法可以在一定程度上缓解该问题带来的影响。应用文献[10]的网络预训练及参数初始化方法,对燃料空气混合物爆炸威力预测神经网络模型进行学习训练,学习训练样本见表1。学习训练结束后,针对表2中的8种情形,利用训练后的神经网络模型开展实际预测,表3为预测值与实际计算值的对比结果。在不改变学习训练样本和预测样本的条件下,采用3层BP网络模型进行预测,与本文设计的神经网络模型的预测结果对比如表4所示。

注: eva. ———evaluation value; cal. ———calculaion value; δ———相对误差,δ = ( eva. - cal. ) / cal. × 100% 。

从表3可以看出,模型的预测结果与实际计算结果相吻合,该模型预测的相对误差为0. 2% ~ 6. 1% ,本文采用的神经网络模型预测方法简便、可行。预测结果表明,随着铝粉含量变化,混合物爆炸威力存在一个最大值,当铝粉含量约65% 时,混合物爆炸威力达到最大; 爆压随铝粉含量增加呈先增后减趋势,爆温和爆热随铝粉含量增加一直呈上升趋势,但气体产物体积随铝粉含量增加呈急剧下降趋势。

从表4可以看出,与3层BP模型比较,本文设计的模型可以减少训练次数、缩短训练时间、提高预测正确率,具有一定的优势。

本文模型适合用于液固混合燃料在空气中爆炸的威力预测,仅局限在小药量无约束空间。今后应开展多种条件下的燃料空气混合物爆炸试验,积累更多的学习训练样本,以便进一步扩大文中所设计神经网络模型的适用范围。

4结论

1) 模型训练及应用结果表明,本文采用的预测方法简便、可行,可以为燃料空气混合物爆炸威力预测提供一种新途径。

2) 与3层BP模型对比,本文设计的预测模型可以减少训练次数、缩短训练时间、提高预测正确率,具有一定的优势。

3) 今后应积累更多的学习训练样本,扩大模型的适用范围。

摘要:燃料空气混合物爆炸威力准确预测研究是学术界的一个难题。针对燃料空气混合物爆炸威力有效预测问题,采用神经网络方法,设计多层神经网络模型,进行实际预测应用。应用结果表明,采用的预测方法简便、可行,可以为燃料空气混合物爆炸威力预测提供一种新途径。相比3层BP模型,设计的预测模型可以减少训练次数,缩短训练时间,提高预测正确率,应用优势较明显。

混合网络模型 第7篇

以F 2 2 、 F 3 5为代表的 一类强机 动目标对 我国国土 防空安全 提出了重 要挑战 , 如何对这 类目标进 行有效地 检测并跟 踪是当前 亟需解决 的问题之 一 。 交互式多 模型 ( I n t e r a c t i n g M u l t i p l e M o d e l , I M M ) 算法[1,2]是一种典 型的机动 目标跟踪 算法 , 通过采用 由多个固 定模型组 成的模型 集来描述 目标的可 能运动模 式 。 由于该模 型集合是 固定的 , 当模型失 配时会造 成跟踪精 度下降 。 在此基础 上 , L I X i a o r o n g提出了变 结构多模 型 ( V a r i a b l e S t r u c t u r e M u l t i p l e M o d e l , V S M M ) 算法[3], 利用一个 时变的模 型集来代 替固定的 模型集合 , 该算法的 有效性依 赖于模型 集合的自 适应调整 。

目前 , 变结构多 模型算法 设计主要 有两种思 想 : 一种是设 计一个过 完备的模 型集合 , 然后在模 型集合之 间进行自 适应切换 或选择[4,5]; 另一种是 根据目标 状态估计 实时在线 生成新的 模型集合[6,7,8,9]。 文献 [ 4 ] 提出了模 型组转换 ( M o d e l - g r o u p S w i t c h i n g ,M G S ) 算法 ,使模型集 根据一定 准则在预 先确定的 相关模型 组之间转 换 , 其存在任 何时刻至 多只有一 个模型组 可被激活 的缺点 。 文献 [ 5 ] 提出了最 小熵反馈 式变结构 多模型 ( M i n i m i z a t i o n E n t r o p y V a r i a b l e S t r u c t u r e M u l t i p l e M o d e l , M E V S M M ) 算法 , 该算法对 模型的在 线估计信 息进行反 馈 , 结合最小 信息熵准 则选取模 型集进行 多模型估 计 , 但信息熵 准则的确 定比较困 难且计算 量过大 。 文献 [ 6 ] 提出了基 于转弯模 型的自适 应变结构 多模型 ( A d a p t i v e V a r i a b l e S t r u c t u r e M u l t i p l e M o d e l , A V S M M ) 算法 , 该算法模 型集的调 整依赖于 转弯速率 , 在协同转 弯模型的 场景下才 能较好的 跟踪目标 。 文献 [ 7 ] 在E M A ( E x p e c t e d M o d e A u g m e n t a t i o n ) 算法[10]的基础上 引入自适 应网格技 术和可能 模型集技 术 , 提出了E q M A ( E q u i v a l e n t - m o d e l A u g m e n t a t i o n ) 算法 ,但该算法 中修正模 型属于独 立模型 ,其修正能 力有限 。文献 [ 8 ] 提出了基 于常加速 模型的混 合网格多 模型算法 , 先给定一 个固定的 粗略模型 集 , 再以目标 运动模式 加速度估 计为依据 对粗略的 模型集进 行划分 , 得到与目 标真实运 动模式更 匹配的子 模型集 , 该算法通 过加速度 估计实时 在线生成 更优的子 模型集 , 能更加准 确的描述 目标真实 的运动状 态 , 从而提升 跟踪精度 。

H G M M算法在跟 踪机动目 标时 ,由于目标 机动可能 会导致目 标加速度 估计不准 确 ,从而引起 目标跟踪 精度下降 。 本文结合 “ 当前 ” 统计模型[11], 利用其当 前机动加 速度均值 能更准确 反映目标 真实运动 模式的优 点 , 提出了一 种基于 “ 当前 ” 统计模型 的H G M M算法 。 该算法以 基于 “ 当前 ” 统计模型 估计得到 的加速度 均值为依 据 , 在H G M M的基础上 进行网格 划分 , 在线生成 目标可能 的运动模 型集合 , 以更符合 目标真实 运动模式 , 并采用交 互式多模 型算法进 行目标跟 踪 。 最后通过 仿真实验 验证了提 出算法的 有效性 。

1HGMM算法

H G M M算法的基 本思路为 :初始时建 立一个粗 略的网格 ( 基于加速 度 ) , 覆盖目标 所有可能 的运动模 式 , 然后根据 基于模型 更新概率 的目标加 速度估计 , 递归调整 网格 , 最后得到 一个与目 标真实运 动模式更 匹配的精 确的细网 格用于滤 波估计 , 其网格划 分过程如 图1所示 。

常见的目 标运动模 型有常速 模型 ( C u r r e n t V e l o c i t y , C V ) 、 常加速模 型 ( C u r r e n t A c c e l e r a t i o n ,C A ) 及协同转 弯模型 ( C o o r d i n a t e T u r n , C T ) ,H G M M算法采用 基于加速 度的模型 来描述目 标的运动 模式 , 该模型涵 盖了C V模型 ( 加速度为 零 ) 、 C A模型 , 对于C T模型 , 虽然该模 型依赖于 角速度参 数w , 但转弯过 程中加速 度时刻在 变化 , 依旧可用 加速度来 描述 。 假设机动 目标的状 态方程与 观测方程 分别为

式中W为零均值 、 高斯过程 白噪声 , V为零均值 、 高斯测量 白噪声 。

采用H G M M算法时 , 目标加速 度估计为

式中 :aj为模型集 中各模型 机动加速 度 ,µ( j)为模型概 率更新 。

H G M M算法网格 划分的准 确性完全 依赖于加 速度估计sˆk的计算 , 当目标做 机动时 , 若其值不 准确 , 则会导致 该算法跟 踪性能下 降 。

2基于“当前”统计模型的HGMM算法

H G M M算法中的 核心是对 目标模式 加速度估 计sˆk( 网格划分 的依据 ) 的计算 ,网格划分 过程中存 在这样的 一个问题 : 若某一时 刻sˆk的值不准 确 , 从而使算 法在第一 次网格划 分时就出 现偏差 , 这会影响 到后续的 进一步细 划分及最 终的跟踪 效果 。 针对这个 问题 , 本文引入 了 “ 当前 ” 统计模型 , 该模型认 为 , 当目标以 加速度机 动时 , 下一时刻 的加速度 取值是有 限的 , 即只能在 “ 当前 ” 的加速度 领域内 , 因此能更 真实地反 映目标机 动范围和 强度的变 化 , 结合H G M M算法提出 了一种基 于 “ 当前 ” 统计模型 的H G M M算法 。 其流程如 图2所示 。

2.1“当前”机动加速度均值

“ 当前 ” 统计模型 采用修正 瑞利分布 来描述目 标机动加 速度统计 特征 。 该模型假 设目标运 动状态为

式中 : G( k) 为输入控 制矩阵 ,W(k ) 是方差为Q(k ) 的零均值 高斯过程 白噪声序 列 , a为 “ 当前 ” 机动加速 度均值 , 即 :

σa2为机动加 速度方差 , 即 :

2.2基于“当前”统计模型的HGMM算法

该算法首 先确定一 个粗略的 模型集M ,M={ai,i=0,1,. . .,8}, 假设网格 距离为D , 如图1所示 。 然后采用 基于 “ 当前 ” 统计模型 的交互式 多模型算 法对该模 型集进行 状态滤波 , 得到当前 机动加速 度均值即 “ 当前 ” 的加速度 预测 , 即 :

式中 :为各模型 机动加速 度均值 ,为各模型 更新概率为转移矩阵 。

以图1为例 , 将a0作为坐标 原点建立 直角坐标 系 , 根据式 ( 5 ) 计算出的 当前机动 加速度均 值ak进行网格 划分 , 可得到细 网格 ( 即新的模 型集合 )Ck={ai1,i=0,1,. . .,4}。 关于细网 格距离 , 我们假设sˆk-1位于图1中▲ 位置 , 而其相应 的细网格 为Ck-1={aij,i=0,1,. . .,4}。 在k时刻 , 如果sˆk依旧位于 网格D=[Ckj-1], 则网格距 离dk为

然后采用I M M算法对得 到的新模 型集进行 交互滤波 。

2.3综合滤波输出

该算法可 进行多次 划分 ( 一次循环 即一次划 分 ) , 最后综合 滤波输出 :

3仿真分析

假设目标 在X O Y平面内飞 行 , 观测噪声 方差R=d i a g{10 02,10 02}, 过程噪声 方差Q=E{w (k)⋅w(k)T}, 其中w(k )是零均值 、 高斯过程 白噪声序 列 , 采样周期T = 1 s ,am a x=[5050]T, 机动频率 α 取1 / 6 0 , 基于C S的H G M M算法粗略 模型集如 下 :a0=[00]T,a1=[400]T,a2=[4040]T,a3=[040]T,a4=[-4040]T, a5=[-400]T,a6=[-40-40]T,a7=[0-40]T,a8=[40-40]T。 各模型的 初始概率 为1 / 9 , M o n t e C a r l o仿真的次 数为5 0次 。 本文所采 用的仿真 软件为M a t l a b 7 . 1 。

仿真场景 一 : 目标运动 模型为C A 、 C V模型 。

A . 一般机动 情况 : 目标在整 个过程中 的加速度 变化如表1所示 。

该场景下 目标初始 状态为X0=[2000 0,500 0,-20 0,20 0,0,0]T。 将本文提 出的基于 “ 当前 ” 统计模型 的H G M M算法与I M M算法 ( 包含9个C V 、 C A模型 ) 及H G M M算法进行 比较 , 仿真结果 如图3所示 。

三种算法 的均方误 差如表2所示 。

从图中可 以看出 , 在仿真场 景下 , 对于一般 机动情况 , 基于C S的H G M M算法和H G M M算法由于 是在线生 成新模型 集 , 能更加匹 配目标真 实的运动 模式 , 故跟踪性 能优于采 用9个固定模 型的I M M算法 。 而基于C S的H G M M算法由于 引入了 “ 当前 ” 统计模型 , 能更准确 地描述目 标的加速 度情况 ,所以其加 速度误差 小于H G M M算法 , 相应的位 置与速度 误差也更 小 。

B . 强机动情 况 : 目标在整 个过程中 的加速度 变化如表3所示 , 该场景下 目标初始 状态为X0=[1000 0,1000 0,15 0,-10 0,0,0]T, 由于基于 粒子滤波 的I M M算法[12]、 M E V S M M算法对于 强机动目 标均有较 好的跟踪 效果 ,故将这两 种算法与 本文提出 的基于C S的H G M M算法进行 比较 ,仿真结果 如图4所示 。

三种算法 的均方误 差如表4所示 。

从图中可 以看出 , 当t < 8 0 s时 , 由于加速 度变化不 大 , 我们可视 为一般机 动 , 此时基于C S的H G M M算法跟踪 性能略优 ; 当t > 8 0 s时 , 加速度急 剧变化 , 基于C S的H G M M算法误差 增大 , 跟踪效果 不及另外 两种算法 , 这主要是 因为C S模型性能 依赖于加 速度参数 , 跟踪性能 受到加速 度参数的 影响 , 且修正的 瑞利分布 本身的局 限性 , 也使得模 型无法非 常快速 、 精确地描 述目标运 动的加速 度情况 ; 当t > 1 0 0 s时 , 基于C S的H G M M算法误差 有所下降 , 总体来说 , 其跟踪性 能要优于M E V S M M等两种算 法 。

仿真场景 二 : 目标的运 动模型为C T模型 。

该场景下 目标状态 初始向量 为X0=[2000 0,500 0,-20 0,20 0,0,0]T。机动目标 在整个过 程中的角 速度变化 如表5所示 ,将本文提 出的基于C S的H G M M算法与A V S M M算法 ( C T模型下有 较好的跟 踪性能 ) 及I M M算法 ( 包含九个C V 、 C T模型 ) 进行比较 仿真结果 如图5所示 。

三种算法 的具体均 方误差如 表6所示 。

从图中可 以看出 , 对于强机 动目标 , 基于C S的H G M M算法依旧 有较高的 跟踪性能 。 I M M算法次之 , 这是因为I M M算法的模 型集选取 时包含多 个合适的C T模型 ,恰好能描 述目标的 部分真实 运动状态 ,因此具有 合适模型 集合的I M M算法性能 优于A V S M M 。 采用A V S M M算法进行 跟踪时 , 对于机动 性较强的 目标 , 在模式变 化初期 , 其中间模 型参数不 稳定 , 会导致跟 踪误差增 大 , 总体跟踪 效果最差 。

4结论

混合网络模型 第8篇

运动目标检测是智能视频监控领域的一项关键技术,为后续行为分析提供研究对象,其检测精度直接影响到系统性能,常见运动目标检测算法有:背景差分法、相邻帧差法、光流法[1]、Vi Be[2](Visual Background Extractor)、混合高斯背景建模法等。背景差分法相对简单,实现比较容易,运算速度快,但其没有背景更新机制,导致运动区域提取不准确;相邻帧差法采用相邻两帧图像差分来提取运动区域,实现容易且计算量小,但此方法会引入拖影区域;光流法[1]通过计算图像的光流场来进行运动检测,时间复杂度较高,不适用于实时性要求高的应用;Vi Be[2]是一种像素级的背景建模算法,计算量小,时间复杂度低,抗噪能力好,能够较好地适应背景的突变,但容易引入拖影区域;混合高斯背景建模法(Gaussian Mixture Model,GMM)[3,4,5,6,7,8]是一种基于像素统计信息的背景表示方法,对噪声具有较强的鲁棒性,但其计算量大,实时性较差。

针对GMM算法计算量大和时间复杂度高的缺点,很多研究人员研究和改善GMM算法,文献[9]提出一种应用改进GMM算法进行运动检测的方法,其最大改进之处在于引入分块模型[9],该方法本质是采用重采样技术降低原视频分辨率,再对新视频利用传统GMM算法进行运动检测,由于新视频尺寸相对于原视频大幅减小,所以此方法大量减少算法计算量,但对传统GMM算法并没做实质性改进。

本文将基于传统GMM算法,综合考虑算法时间、空间复杂度和检测准确率,采用分块处理技术和概率更新策略改进传统GMM算法,提出一种基于块模型的混合高斯模型运动目标检测方法,与传统GMM算法为每个像素点建立一个GMM模型相比,此方法考虑了像素间空域信息,通过为每个块建立一个GMM模型减小模型总数,从而减少算法内存消耗,同时采用概率更新策略对块内模型参数进行更新,减小算法计算量。实验表明此算法保证了检测效果,改善了算法时间和空间复杂度。

1 混合高斯背景建模法

传统GMM算法是基于像素统计信息的背景建模方法,该方法利用在较长时间内像素的概率密度、均值、标准差等统计信息来建立背景模型,再使用统计差分方法(如3σ原则)进行运动检测。传统GMM算法假设各个像素点间不相关,对于每个像素点可以用单或多个高斯分布来描述其在时域内的分布曲线,高斯概率分布如图1所示。

对于混合高斯模型,各像素点按不同权值的多个高斯分布叠加来建模,各高斯分布的权值与分布参数随时间更新。假设第t时刻,像素点(x0,y0)取值集合为{X1,X2,…,Xt}={I(x0,y0,i)|1≤i≤t},其中I为视频流。若用K个高斯分布表征图像各像素点,则每个像素点的概率为:

其中,K为高斯分布个数,ωi,t为第i个高斯分布t时刻权重,满足0≤ωi,t≤1且权重总和为1,Xt为t时刻像素值,μi,t、∑i,t分别为第i个高斯分布t时刻均值与方差,η(Xt,μi,t,∑i,t)为第i个高斯分布的概率密度,其定义如下:

综上,传统GMM算法运动目标检测具体流程如下:

Step1:新像素值Xt与当前K个高斯模型按式(3)进行比较,找到匹配新像素值的分布模型,即与该模型的均值偏差在2.5σ以内。

Step2:若所匹配的模型符合背景要求,则该像素属于背景,否则属于前景。

Step3:各模型权值按公式(4)进行更新,其中α是学习速率,对于匹配的模型Mi,t=1,否则Mi,t=0,再对各模型权重进行归一化处理。

Step4:未匹配模型的均值μ与标准差σ不变,匹配模型的参数按公式(5)-(7)进行更新:

Step5:若Step1中没有任何模型与之匹配,则权重最小的模型被替换,即该模型的均值被设置为当前像素值Xt,标准差和权重设置成初始值。

Step6:各模型根据ω/σ降序排列,权重大、标准差小的模型排在前面。

Step7:选前B个模型作为背景,B满足下式(8),参数T表示背景所占比例:

2 分块处理技术

分块处理技术指将图像按照一定块大小划分成很多小块,后续处理以这些小块为单位进行。在传统GMM算法中,假设对各像素点的处理互不影响,为每个像素点建立一个混合高斯模型,因此传统GMM方法并没有考虑像素间空域信息。通过对现场视频的仔细观察,发现图像相邻像素点的像素值非常接近(如图2所示的12×12矩阵),因此可将图像按适当的块大小(W×W)分成很多小块,对各小块用一个混合高斯模型替代原来的W×W个模型,减小模型总数,进而减少算法的存储空间。

假设传统GMM算法的存储空间为RGMM,其分为混合模型所占内存量RModel和其它变量所占内存量Rother,则:

分块处理技术仅将模型个数减少为传统GMM算法模型个数的1/(W×W),而其它空间开销并未改变,因此改进算法所需存储空间为:

算法所需存储空间的减少量和减少率分别为:

公式(11)和(12)表明,在分辨率一定时,算法所需存储空间减少量和减少率随着块宽的增加而增大,当块宽增大到一定程度后,存储空间的减少量和减少率增大趋势变缓;同时块宽一定时,存储空间的减少量和减少率受RModel的影响,而RModel与视频分辨率有关,分辨率越大RModel也越大,因此存储空间的减少量和减少率随着视频分辨率的增大而增大。

图2为分块处理技术示意图,图中间的12×12(中间下)和9×9(中间上)的矩阵来自于原图像两个部分的R通道数据。从9×9大小矩阵可以发现很多相邻像素值并不相近,甚至差别很多,其原因是此矩阵对应于原图像边缘区域,像素值波动较大,解决方法是对原图像进行边缘模糊,减少相邻像素间的波动。

边缘模糊可以采用图像滤波技术中均值滤波技术[10]来实现,均值滤波技术输出是包含在滤波器模板邻域内像素的平均值,这种处理方式降低了图像灰度的“尖锐”变化,能较好地对图像边缘区域进行模糊。

均值滤波技术过程由式(13)给出:

其中,F为M×N的原图像,U为m×n(m,n为奇数)的滤波器模板,G为输出图像。对于滤波器模板,为了达到较好的边缘模糊处理效果,本文采用第一类模板(模板内的系数全为1)对图像进行均值滤波,模板尺寸大小为5×5。

3 概率更新策略

基于块模型的混合高斯模型运动目标检测以块为单位建立混合高斯模型,如何利用块内的像素对建立的块模型进行更新以达到降低算法时间复杂度目的是整个算法核心,直接影响算法的运行效率。本节提出一种概率更新策略对以块为单位建立的混合高斯模型进行模型参数更新。

通过对图像进行边缘模糊处理以后,本文假设块内的所有像素值基本保持一致。对于基于块模型的混合高斯模型,参数更新方法分为两种:第一种就是块内的所有像素点都对这个模型进行更新,此做法并没有达到减少算法计算量的目的;第二种做法是本节提出的概率更新策略,由于块内的像素波动较小,因此可以用块内的某几个像素点对模型进行参数更新,概率更新策略的具体做法:块内的像素以一定的概率P对混合高斯模型进行更新,从而降低算法的计算量。

假设传统GMM算法处理每帧图像耗时为TGMM,算法对各像素点的处理时间分为模型更新时间Tu和其它操作(如匹配操作等)时间Tother,本文改进算法耗时为Tnew,图像大小为M×N,混合高斯模型中高斯模型数为K,则:

对于基于概率更新策略的模型更新方法,在某一个时刻,块内进行模型更新的像素点数期望为W×W×P,为了保证从期望角度看某个时刻块内至少有一个像素点对模型进行更新,应保证W×W×P≥1,本文设定P=1/(W×W),则:

其中,Tp为边缘模糊处理耗时。本文改进算法与传统GMM算法相比,耗时减少量和减少率分别为:

实验表明,边缘模糊处理耗时与传统GMM算法耗时的比值Tp/TGMM≈0,因此,公式(17)可化简:

公式(16)和(18)表明:改进算法减少了处理每帧图像所消耗的时间,耗时的减少量与视频分辨率有关,但耗时减少率与视频的分辨率无关,同时这两者都随着块大小的增大而增大;结合第3节公式(11)和公式(12)可知,本文改进算法改善了算法的时间与空间复杂度。但是,当块宽被设定为1时,d T=0,dR=0,P=1,此时本文改进算法与传统的GMM算法的区别仅在处理的视频源不同,传统GMM算法处理的视频是原始视频,而本文处理的视频是经过边缘模糊处理后的视频。

综上所述,本文改进算法的具体流程如下:

Step1:对图像以W×W块大小进行分块处理,对每个块建立一个混合高斯模型(即K个高斯模型)。

Step2:对图像进行边缘模糊处理。

Step3:新像素值Xt与当前K个高斯模型按式(3)进行比较,找到匹配新像素值的分布模型,即与该模型的均值偏差在2.5σ以内。

Step4:若所匹配的模型符合背景要求,则该像素属于背景,否则属于前景。

Step5:以概率P=1/(W×W)对各模型权值按公式(4)进行更新,其中α是学习速率,对于匹配的模型Mi,t=1,否则Mi,t=0,然后对各模型权重进行归一化处理。

Step6:未匹配模型均值μ与标准差σ不变,匹配模型参数按公式(5)-(7)以概率P=1/(W×W)进行更新。

Step7:若Step3中没有任何模型与之匹配,则以概率P=1/(W×W)将权重最小的模型替换,即该模型均值被设置为当前像素值Xt,标准差和权重设置成初始值。

Step8:各模型根据ω/σ降序排列,权重大、标准差小的模型排在前面。

Step9:选前B个模型作为背景,B满足公式(8),参数T表示背景所占比例。

4 实验与结果分析

由于本文改进算法没有限定块大小取值,根据公式(11)和公式(16)可知:块大小影响着算法的运行效率和内存消耗;同时本文改进算法做了边缘模糊预处理,对边缘模糊处理带来的影响也未进行说明。下面通过实验来确定块大小取值,以及验证边缘模糊处理的影响,同时将确定的块大小值应用到算法中对不同分辨率和不同运动目标像素数的视频进行运动检测,进而验证改进算法相对于传统GMM算法在运行效率与内存消耗上的改善。实验在一台处理器为Intel(R)Core(TM)i5-3470CPU@3.20GHz,内存为8G的PC机上完成,算法程序利用Open CV库、采用Visual Studio 2010编译器编写。

4.1 实验一:确定块大小取值和验证边缘模糊处理的影响

实验一视频分辨率为CIF(352×288),为了在实验中能更好地将本文改进算法与传统GMM算法进行比较,本文将块宽W从1到5分别代入到改进算法中进行实验并对比各算法的检测效果。具体的实验结果如图3与表1所示,图3为不同块大小算法耗时与存储空间曲线图,表1为不同块大小情况下的检测效果图。

对图3进行分析,可知:在视频监控平台上,视频分辨率一定时,改进算法耗时与存储空间随着块宽W的增加而减少,但当块宽W大于3时,算法的耗时与存储空间的减少逐渐趋于平缓,主要因为公式(11)和(16)受因子1/W×W的影响,而该因子是关于块宽W的反比例函数。而表1表明,当块宽W超过3时,检测结果与传统GMM算法的检测结果相比出现很多噪点,检测效果逐渐下降。究其原因主要是因为当块宽超过某个范围时,块内像素值波动较大,以这种块为单位建立的混合高斯模型并不精确,导致了噪声的出现。

通过对比表1中传统GMM算法与本文改进算法(W=1)的检测效果可知:边缘模糊处理会在目标的边缘区域对检测效果产生一定程度的影响,但其整体的检测效果与传统GMM算法基本一致,主要因为边缘模糊只处理平滑图像的边缘区域,对于图像的其它部分平滑效果较弱。因此本文得出:边缘模糊处理会在一定程度上影响边缘区域的检测效果,但其影响程度较小,对运动目标的整体检测效果不会有太大的影响。

为了更加直观地分析,本文对表1的检测结果进行量化处理,采用衡量目标形状完整性的两个性能指标[11,12]:检测率(DR)和误报率(FAR)。

其中,TP为检测出属于真实前景的像素数,FN为未被检测出的前景像素数,FP为被误当作前景而检测出的属于背景区域的像素数。对表1按公式(19)和(20)进行量化处理,得到表2的实验—量化结果。

可见,当块宽W不超过3时,检测效果与传统GMM算法检测效果基本一致,检测率DR相差不大,且误报率FAR为0或接近0;但当块宽W大于3时,检测结果中出现噪点,误报率FAR相应增加。综上分析可得,将块大小设置为3×3时既能保证算法检测效果,又能获得较低的算法耗时和存储空间。

4.2 实验二:对不同分辨率、不同运动目标像素数的视频进行运动检测

通过实验一,确定了改进算法的最佳块大小参数值为3×3像素,并验证了模糊处理对运动目标检测的影响不大。下面验证改进算法对不同分辨率和不同运动目标像素数的视频的检测效果和算法的运行效率与内存利用率。实验具体做法:将改进算法与传统GMM算法应用到不同分辨率和不同运动目标像素数的监控视频(包括Sub QCIF、QCIF、CIF、2CIF、DCIF、4CIF、WD1、720P八种分辨率)进行运动检测,对比两个算法的检测率(DR)、误报率(FAR)以及处理每帧图像的平均耗时与算法的存储空间。实验二的结果如图4和表3所示,同时实验表明,对于具有不同运动目标像素数的监控视频,其检测率DR和误报率FAR具有与图4相似的曲线分布。

图4表明:本文改进算法在分辨率不低于CIF情况下,其检测率与误报率与传统GMM算法基本一致,但当视频分辨率低于CIF时,改进算法的整体检测效果较差,其主要是因为分辨率过低时,块内的像素点波动较大,边缘模糊处理也无法消除这种波动,可见本文改进算法并不适用于分辨率低于CIF的情况。由表3可见:在算法耗时方面,改进算法相对于传统GMM算法耗时减少量随着分辨率的增大而增大,而减少率基本维持不变,在不考虑分辨率低于CIF情况时其平均耗时减少率为46.16%,符合公式(16)和(18)的表述;在算法存储空间方面,改进算法相对于传统GMM算法存储空间减少量与减少率都随着视频分辨率的增加而加大,而且视频分辨率越高,存储空间减少量和减少率越大,与公式(11)和(12)表述一致。

综上,改进算法在块大小取值为3×3像素、分辨率不低于CIF时可保证与传统GMM算法有基本一致的检测效果,同时大量减少了算法耗时与存储空间,平均耗时减少率为46.16%,存储空间减少率不低于54.15%。

5 结束语

在传统的混合高斯模型基础上,本文提出利用分块处理技术与概率更新策略来对传统混合高斯模型进行改进,改进算法在耗时与存储空间这两个方面得到了很大改善,同时有效利用了图像像素间的空域信息,表现出了较好的环境适应能力。实验结果表明,在视频分辨率不低于CIF时,该算法与传统GMM算法检测效果基本一致,能够较为完整地、准确地提取出运动目标,同时改善了时间和空间复杂度。

参考文献

[1]Denman S,Fookes C,Sridharan S.Improved Simultaneous Computation of Motion Detection and Optical Flow for Object Tracking[C].Digital Image Computing:Techniques and Applications,Melbourne VIC,2009:175-182.

[2]Olivier Barnich,Marc Van Droogenbroeck.Vi Be:A universal background subtraction algorithm for video sequences[J].IEEE Transactions and Image Processing,Jun.2011,20(6):1709-1724.

[3]Chris Stauffer,Grimson W E L.Adaptive background mixture models for real-time tracking[C].IEEE Computer Society Conference on Computer Vision and Pattern Recognition.Fort Collins,Co,1999:246-252.

[4]Greggio N,Bernardino ALaschi C,et al.Self-adaptive Gaussian mixture models for real-time video segmentation and background subtraction[C].10 th International Conference on Intelligent Systems Design and Applications,Cairo,2010:983-989.

[5]Chen Ze-zhi,Ellis T.Self-adaptive Gaussian Mixture Model for urban traffic monitoring system[C].IEEE international Conference on Computer Vision Workshops,Barcelona,2011:1769-1776.

[6]Zhang Fan,Yang Lei,Zhang Guang-wen.Adaptive Fast Gaussian Background Subtraction Algorithm[C].2nd International Conference on Computer Science and Network Technology,Changchun,2012:766-771.

[7]向世明,陈睿,邓宇,等.在线高斯混合模型和纹理支持的运动分割[J].计算机辅助设计与图形学学报,2005,17(7):1504-1509.

[8]陈允杰,王顺风,王利,等.基于各向异性Gibbs随机场与高斯混合模型的脑MR图像分割算法[J].计算机辅助设计与图形学学报,2007,19(12):1558-1563.

[9]张燕平,白云球,赵勇,等.应用改进混合高斯模型的运动目标检测[J].计算机工程与应用,2010,46(34):155-157.

[10]Rafael C Gonzalez,Richard E Woods.阮秋琦,等.数字图像处理[M].3版.电子工业出版社,2013:93-94.

[11]周建英,吴小培,张超,等.基于滑动窗的混合高斯模型运动目标检测方法[J].电子与信息学报,2013,35(7):1650-1656.

混合网络模型 第9篇

植物的性状分为质量性状和数量性状,两者在表现和遗传上是不同的。经典数量遗传学基于遗传学和统计学的一些假定,导出了一系列分析数量性状遗传的理论,大量实验数据证实在上述假定的基础上导出的基本公式与理论是有效的。然而,受上述假定的限制,有些研究难以深入,如多基因的基因效应被看成是微效和相等的。盖钧镒等认为大多数量性状多基因间的效应并不相等,也存在主效和微效之分,并依此提出了数量性状的泛主基因+多基因遗传理论;同时结合相应的统计学方法,建立了植物数量性状遗传体系。该遗传体系既可对单个分离世代(如F2、DH、RIL群體等)进行简单分离分析,还可结合不分离群体(如P1、P2和F1群体)进行多世代联合分析。该方法适用于育种工作者利用杂种分离世代的数据对育种性状的遗传组成做出初步判断,制定相应的育种策略,也可用于校验QTL定位所揭示的性状遗传组成。目前,该遗传理论已经将遗传模型拓展至4对主基因+多基因的分离分析方法,并在大豆、水稻、小麦、玉米、棉花以及西红柿、黄瓜等作物中得到了广泛的应用。本文则侧重探讨该遗传理论在小麦抗病、品质及产量相关性状研究中的应用,旨在分析小麦相关性状的遗传组成,为育种提供有益的参考。

高斯混合模型的矩阵推广 第10篇

在生产实践、科学实验与自然科学的研究中,常常需要我们去分析一系列的随时间变化的前后相互关联的观测数据,也就是我们所说的时间序列,对时间序列数据的精确处理可以使我们对未来的情况做到较好的预报和控制,对数据进行正确的建模,从而使我们发现数据中隐藏的内在规律. 时间序列的例子在一些领域中是极丰富的,诸如经济、商业、工程、自然科学( 特别是地球物理学和气象学) 和社会科学,从Bax和Jenkins所普及的ARIMA类模型到现在,处理时间序列的问题一直是被人们所广泛研究的,在使用线性和非线性的方法上都取得了很大的发展.

在通常处理实际的时间序列问题时,为了便于计算和得到一些较好的性质,我们总是假定时间序列的误差项是服从高斯分布的白噪声,但实际情况并非如此简单,很多时间序列表现出非高斯性,例如: 序列的平坦趋势、突变性、异常值点和变点等,当我们想要找到数据本身的特性对其进行预测和拟合时,根据数据所表现的特性准确建模就显得非常重要.

1996年LE等人根据Raftery ( 1985 ) 的MTD模型提出了一种新的非线性时间序列模型———GMTD模型:

即给定过去的值后Yt的条件分布是混合正态分布. 这个模型的特点在于它能表现出像平坦趋势、异常值、变点等实际时间序列数据常表现出来的非高斯性. 并且GMTD模型的形式简单,容易处理,可以利用EM算法进行参数的估计和拟合. 近年来,为了使模型具有更广泛的应用范围,很多人对这个模型做了推广,例如: 2000年Wong和Li将GMTD模型推广 为MAR模型, 在2001年又推广 为logistic MAR模型和异方差情形,Wong和Chan( 2003) 将模型应用到市场收益上.

混合模型是统计模式识别非常重要的方法之一,它是描述真实数据复杂性的常用方法,也是解决分类或者聚类问题的常用方法之一,在最近兴起的数据挖掘研究中也常用到它. 混合模型的参数估计方法有很多,通常人们所熟知的是EM算法,在用它来做模型参数的估计时,混合的权重及成分参数是通过数据似然的局部最大化来一起估计的.

2. GMTD 模型的矩阵推广

在现实世界里,很多的时间序列数据并不是仅仅用一维的模型就能够得到很好的建模,有些时候我们需要的是多维的模型. 例如在股票数据里,某一只股票当前的价格可能不仅仅是和这只股票过去的价格有关,也许还同另外的其他股票的过去价格有关,为此,为了更好的对数据有更加准确的描述,我们对GMTD模型进行了推广,将它由一维的混合正态分布转化为多维的混合正态分布,即:

在时间序列分析中,序列的平稳性在模型建立和序列信息提取中具有非常重要的意义,为此我们给出多元混合转移正态分布( MGMTD) 的一阶矩平稳性条件.

定理1对于( 2) 式所定义的时间序列yt是一阶矩平稳( 或均值平稳) 的充要条件是方程

这样我们得到了一个向量形式的差分方程,若将Eyt看作为zt,则差分方程可以写为:

那么由汉密尔顿( 1999) 的结果可以得到,这个差分方程是平稳的充要条件为所有满足:

这样利用Benés( 1967) 给出的结果,我们可以知道上述条件就是多元混合转移正态分布( MGMTD) 的一阶矩平稳条件.

为了将该模型应用于实际问题的时间序列建模分析中,我们需要给出分布模型参数估计的方法. 由( 2) 我们给出了多元混合正态的密度函数表达式,因此我们可以采用EM算法来对其进行参数估计,为此在下面内容我们推导该模型参数估计的EM算法递推公式.

首先引入潜在变量ztk,t表示第t个观测值,k表示混合模型的第k个成分,于是有:

那么根据EM算法,我们可以得到完全数据的条件对数似然函数定义为:

利用EM算法:

以上两步重复进行,直到某一个特定的收敛准则满足.

在E - step通过对函 数求导数 并利用权 重的性质,我们可以得到权重的估计式:

若要求出的参数估计式可以通过解下列方程得到:

上面第二个式子可以进一步简化为:

因此,根据矩阵的求导公式我们可以得到参数估计的表达形式为:

这样我们就得到了关于多元混合正态分布参数的极大似然估计的EM算法迭代表达式,可以通过该算法来计算模型中参数的估计值.

3. MGMTD 模型在能源价格预测中的应用

为应对国际金融危机的影响,及时、准确反映我国主要能源产品的价格变动情况,国家统计局启动“价格调查应急机制”,对主要的能源产品进行了价格调查. 由于煤炭和石油都是不可再生的重要能源资源,对其的开采和买卖对国家的发展具有重要的战略意义. 为此,本文通过由国家统计局从2009年11月到2011年12月的炼焦煤炭和天然原油的半月度价格数据,数据的序列长度为50. 对该二维时间序列数据进行建模,一方面研究这两种主要的能源产品的价格波动模型,另一方面希望通过数据驱动的方式研究它们之间是否存在相互的关联作用,彼此之间的价格是否存在显著的影响. 对该问题的研究,将有助于对这两种重要资源的调控.

将该数据集从2009年11月到2011年12月的50个二维时间序列进行标准化预处理后,序列图形可参见图1. 从图1中可以发现这两种能源产品的价格整体都呈现上升趋势,并且通过对炼焦煤炭和原油的价格序列分别进行单位根检验,发现两者都是显著的非平稳序列. 此外,对图1中的两个价格序列做相关检验,发现两者之间存在显著的相关关系,从图1也可以发现,可能存在由于价格的变化导致两种能源产品需求的变化或供应量的变量,从而影响到其能源产品的价格. 为了通过数据驱动的方式,挖掘出数据本身所隐藏的规律,本文采用高斯混合模型的矩阵形式对该二维时间序列进行建模分析.

( 实线为炼焦煤炭价格,虚线为天然原油价格)

本文采用混合模型成分个数为p = 2的MGMTD模型形式为:

其中yt是二维向量,分别代表标准化后的炼焦煤炭价格数据和原油价格数据,ys= ( y1,…,ys)T. 则利用前面所给出的矩阵形式下的混合高斯模型的EM算法,可以得到未知参数和参数矩阵的估计如下:

则根据模型可以得到二维向量的一步预测模型为:

其中为炼焦煤炭的标准化价格为天然原油的标准化价格,则利用模型( 4) ,可以得到炼焦煤炭和原油的价格预测结果分别见图2和图3. 从图2和图3中可以发现,利用MGMTD模型,虽然样本量比较少,只有50个,但是我们可以得到较好的预测序列,特别是对于价格趋势的预测尤其准确.

( 实线为预测值,虚线为真实值)

上一篇:引导小学生习作下一篇:经济跨越式发展