使用主成分分析的方法对数据集进行降维,将滑动窗口引入到贝叶斯网络分类算法中,从而得到改进的贝叶斯网络分类算法。实验证明,改进的算法能够有效地降低分类数据的维数,同时该算法建立的入侵检测模型能够更好地检测出已知的入侵攻击类型。
当今在全球范围内,对计算机及网络基础设施的攻击已经成为一个越来越严重的问题,与此同时,入侵检测技术也成为人们日益关注的研究课题之一[1]。从当前的一些研究成果来看,已有的一些检测技术对于已知的入侵行为检测精度高,误报率较低,但对于未知攻击的入侵模式的检测率和误报率的结果均不太理想,而且在时效性方面也不能令人满意。因此如何建立具有较强的有效性、自适应性和可扩展性的入侵检测模型成为入侵检测领域中重要的研究课题[2]。
由于贝叶斯网络具有坚实的数学理论基础以及综合先验信息和样本信息的能力,近年来已成为入侵检测模式分类的研究热点之一。但是,基于贝叶斯网络的入侵检测技术在对数据进行检测时存在两个问题:其一[3]是贝叶斯网络结构节点太多,分类过程中的计算量呈指数增长,导致分类效率较低;其二是在检测的过程中没有考虑到当前的攻击行为和安全状态,仅仅是根据原始训练数据集生成的固定不变的贝叶斯网络来进行测试,对检测的精度造成一定的影响。
对于上述第一个问题,本文提出基于主成分分析的特征提取方法。利用主成分分析的降维思想,减少训练数据的变量,进而简化贝叶斯网络。对于第二个问题,本文提出滑动窗口机制。该机制将窗口中的数据设为训练数据集,具体解释如下:首先将测试数据集追加到训练数据集的尾部,初始窗口为原始训练数据集,每当检测完N条测试数据时,将滑动窗口向下移动N条数据(窗口大小保持不变),这样就可以得到一个不断更新的训练数据集。由此,训练得到的贝叶斯网络就包含系统当前的安全信息。实验证明,本文提出的方法可以有效地提高分类效率和检测精度。
主成分分析
主成分分析也称主分量分析,利用降维的思想,把多指标转化为少数几个综合指标[4]。
主成分算法的实现如下[5]:
1.对训练集矩阵进行标准化处理,
得到矩阵
其中,
2.求相关矩阵
式中i为标本编号,j,k=1,2,……p。其中,。
3.求R矩阵的特征值和特征向量
由于R是一个对称矩阵,所以在计算中只要对R的上三角矩阵求特征值和特征向量即可。
4.求出主成分
将求出的特征值按大小依次排列,便得,
根据
原则确定m,并依次排列特征向量,
就可得到我们所需的主成分。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。