/2

基于随机森林算法的网络入侵自动识别模型模型体验

模型简介 技术文档 购买咨询
互联网 0 394 0 ¥399

基于随机森林算法的网络入侵自动识别模型

一、模型应用

互联网络的蓬勃发展给人们的工作生活带来极大的便利,然而,随着现代化网络应用的普及,伴随而来的网络不安全因素也给网络信息安全带来了严峻挑战,传统的网络安全技术已经很难对付这些日益严重的安全威胁,所以我们就有必要去开发专门的工具去避免这些不安全因素的攻击,而入侵检测技术便可以作为一种很重要的技术为我们所用。

随着网络入侵行为的经常发生,网络攻击的方式也呈现出多样性和隐蔽性的特征。当前网络和信息安全面临的形势严峻,网络安全的主要威胁有:

image001.png

KDDCup99网络入侵检测数据背景简介:

1998年美国国防部高级规划署(DARPA)在MIT林肯实验室进行了一项入侵检测评估项目。林肯实验室建立了模拟美国空军局域网的一个网络环境,收集了9周时间的 TCPdump网络连接和系统审计数据,仿真各种用户类型、各种不同的网络流量和攻击手段,使它就像一个真实的网络环境。这些TCPdump采集的原始数据被分为两个部分:7周时间的训练数据大概包含5,000,000多个网络连接记录,剩下的2周时间的测试数据大概包含2,000,000个网络连接记录。

基于KDDCup99的部分数据,本次数据挖掘建模目标如下:

1)归纳出入侵的关键特征

2)构建入侵的识别模型。

二、实现流程

KDDCup99网络入侵识别流程如 图 1 所示,主要包括以下步骤:

  1. 使用KDDCUP99中的网络入侵检测数据包kddcup.data_10_percent,该数据包是对

  2. kdd_data数据包(490万条数据记录)10%的抽样;

  3. 对样本数据进行探索分析,通过对41个固定特征属性的分析,发现比较能体现出变化的是前31个特征属性,因此对连接记录的分析处理是针对该31个特征属性;

  4. 对样本数据进行预处理,包括数据清洗,缺失值处理和数据变换;

  5. 构建建模样本集;

  6. 构建KDDCUP99网络入侵识别模型;

  7. 进行模型评价;

  8. 模型优化。

QQ截图20181022165940.png

本案例基于模拟美国空军局域网网络环境记录的KDDCup99数据集,重点介绍了数据挖掘中各类分类算法的应用。

三、核心技术

  • C4.5决策树

  • 随机森林

  • BP神经网络模型

四、你可以将本模型用于

  • 教与学:可落地操作、学生参与度高、交互性强;

  • 科研:将随机森林算法与具体行业应用结合,为科学研究提供素材;

  • 生产:将模型改进后直接用于实际生产环境:网络安全。

五、运行环境

windows/linux/mac OS,64位操作系统,内存:8GB及以上,R3.5.1。

六、资源展示


您尚未登录,请登录后购买! 【马上登录

评论已有 0

模型资源列表

基于随机森林算法的网络入侵自动识别模型

相关模型推荐

联系我们

电话:(020)22205718

热线:40068-40020

地址:广州黄埔区开泰大道36号

邮编:510000

电邮:services@tipdm.com