基于特征选择的工业互联网入侵检测分类方法

(整期优先)网络出版时间:2023-01-07
/ 2

基于特征选择的工业互联网入侵检测分类方法

潘勇

青岛特殊钢铁有限公司 山东省青岛市 266000

摘要由于行业中使用的互联网接入技术多种多样,难以维护,容易受到攻击。为了解决这一安全问题,必须建立适当的防御系统来识别入侵攻击。传统的入侵检测系统可以检测到较少的攻击。互联网产业的发展使得全社会的“工业互联网”一词成为电子、钢铁、矿业和能源等制造业的统称。工业互联网是将工业产品融入互联网,将工厂、车间和工厂融入工业系统。员工和客户利用互联网作为网络平台,推动行业的智能发展,实现行业联网,共享资源。

关键词工业互联网;入侵检测

随着网络技术的发展和扩展,网络安全是世界各国的共同目标。实践表明,防火墙和用户身份等安全措施并不能充分保护网络和计算机系统。为了确保网络安全,有必要迅速高效地识别新的入侵行为。入侵检测是一种主动、安全的方法,通过收集和分析有关受保护系统的信息来监视入侵。

一、工业互联网

考虑到工业互联网的安全性,入侵检测系统(IDS)可以高效地识别网络攻击,实时监控网络状态,并在检测到入侵者时立即做出反应。入侵检测系统的关键是检测攻击。传统的入侵管理系统允许根据审计信息跟踪可疑用户行为。第一个实时入侵检测专家系统通过状态转换分析进行部署和改进之前,攻击检测是网络安全领域的热门课题。但是,鉴于工业互联网环境日益复杂,传统的入侵控制系统面临着诸多挑战,如网络资源利用率高、分析网络流量的能力不足以及监控攻击的能力差、误报率较高。随着机器学习和深度学习模式的引入,许多科学家将机器学习和学习模式应用于互联网入侵检测行业标准系统,以减少传统入侵检测系统的瓶颈。通过引入传统的计算机学习系统和高级入侵检测系统,可简化入侵检测问题的检测和分类。研究表明,机械学习和高级学习模式能够有效地识别正常和异常行为。针对特定类别的攻击,例如DOS,Generic,Exploits和其他异常攻击。

二、基于特征选择的入侵检测分类方法设计

1.研究框架。研究分为五个领域:互联网数据预处理、特征选择、模型培训和验证、绩效评估和特征分析。数据预处理,对UNSW—NBl5中数据属性进行了不同维的分析,并按特征类型统一清除和标准化。特征选择,初步处理原始数据集后,计算皮尔逊系数,通过实验选择确定各个特征的意义,达到该目标的最优阈值。训练并验证,传统机器用于模型培训和认证,例如辅助向量、回归逻辑模型、k表示法、决策结构、随机森林和多级感知机。卷积神经网络体积模型、时区网络等详细学习模块。评估分析,对行业内二分类和多分类互联网流量的分类进行了研究。二分类检测常规攻击和识别攻击的能力。多分类确定攻击类型,根据评估参数的精度确定哪种模型具有最佳的分类结果。特征分析,根据分类结果,分析了不同特征对分类结果及其从属关系的影响。

2.预处理。工业互联网必须从各种工业情景中收集数据以形成记录。但是,由于设备、网络、人员和其他因素的可用性以及某些数据的性质,采集过程可能导致某些数据中的错误或偏差。因此,必须准备基线数据以供以后的实验使用。工业互联网流量数据的主要特点是连续性和离散型。连续性质会标准化连续数据以调整区域大小。

3.特征选择。在入侵过程中发现的大多数数据都包含冗馀和独立的数据函数,需要提取和选择这些数据函数进行实验。常用方法包括过滤、包装和嵌人法。过滤法包括评估每个性质的值,以及设定筛选限制。包装法基于过滤法,实现了对各种元素的交互式控制,并对计算机学习算法进行了评估。嵌人法根据评价函数特征评估子组的特征。一般评估功能包括距离、信息和依赖性度量。通过计算样本之间的距离度量对距离测量进行分类。越小距离可能属于同一个类别,通过计算增益和熵来测量信息。计算值越高,分类器的性能越好。基准标签用于评估特征或类别与特征之间的从属关系,与类别密切相关的功能被视为良好。

4.分类模型。行业互联网入侵检测系统使用多计算机学习和培训模型将流量数据分类为二分类和多分类,以识别攻击类型并正确分类。在机器学习模式中,逻辑同归通常用于解决具有二分类和多分类问题。预测由逻辑函数进行调整。向量机支持超平面数据的分类,学习攻击模型,并在学习过程中进行分类。这尤其适用于具有大属性的线性分类和数据集。离k最近的分类是分类模型中最简单的分类之一。评估最接近未知模式的k类时,会将其划分为大多数示例类的k点,并使用样本属性值在决策树中进行分类。树中的节点指定数据集属性,分支指定决策拆分规则。基于多个决策结构的随机森林可以有效防止拟合使用。通过预测每棵树,我们最终得到了一个主要涉及多个分类的最优解决方案。在工业互联网上,不同的应用场景生成不同的网络流数据。流量选择直接影响互联网入侵检测的分类结果。

通过计算皮尔逊系数并选择分类结果相关联的特征,提高了模型的精度。但是,不考虑特征交互对分类效果的影响,也不考虑主测量特征之间的线性关系。今后的任务将侧重于分析和研究与非线性特性有关的测量。]确定对不同类型攻击有显着影响的特征特征。此外,入侵检测系统是智能的,可以自动检测和响应环境中的更改。优化多功能网络流攻击算法,加快识别每一次攻击的多分类结果,采用可视化技术直观、生动、三维地呈现检测。

参考文献:

[1]蒋太恩.网络安全入侵检测:研究综述[J].软件学报,2020,11(11):1460-1466.

[2]毛晓铮.特征选择算法研究综述[J].模式识别与人工智能,2020,20(2):211-218.

[3]康楚平.WOS-ELM算法在入侵检测中的研究[J].小型微型计算机系统,2019,36(8):1779-1783.

[4]张波.基于SVM和粗糙集理论的用户概貌攻击检测方法[J].小型微型计算机系统,2019,35(1):108-112.

[5]陈旗洋.基于特征选择的轻量级入侵检测系统[J].软件学报,2020,18(7):1639-1651.

[6]李昊.浅析SVM和粗糙集理论的用户概貌攻击检测方法[J].小型微型计算机系统,2019,35(1):108-112.