买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东技术师范大学
摘要:本发明公开了基于Transformer的网络入侵检测方法及系统,所述方法包括:构建网络入侵检测数据集,设置数据集规范;基于数据集规范对网络入侵检测数据集进行预处理;将预处理后的数据进行数据划分,得到划分后的数据集;使用对比学习对划分后的训练集进行训练,得到初步训练结果,将初步训练结果输入机器学习模型进行训练,获得特征子集;将特征子集传入Transformer模型分别进行训练,保存两个网络入侵检测模型,记作Model1和Model2,记录模型的准确率;使用所述Model1和Model2分别对划分后的测试集进行测试,得到模型的预测值,对所述预测值加权判别后输出分类结果,完成对网络入侵的检测。
主权项:1.基于Transformer的网络入侵检测方法,其特征在于,所述方法包括:S1.采集网络入侵检测数据流,构建网络入侵检测数据集,并根据数据集设置数据集规范;所述S1中,所述网络入侵检测数据流为表格数据,所述表格数据由数值字段和分类字段组成,将所述表格数据进行分类,区分出数值字段和分类字段,并根据所述数值字段与所述分类字段设置数据集规范;S2.基于所述数据集规范对所述网络入侵检测数据集进行预处理,得到预处理后的数据;所述S2中,基于所述数据集规范对所述网络入侵检测数据集进行预处理,得到预处理后的数据的具体方法包括:基于所述数据集规范对数值字段的特征值进行对数变换,得到对数变换后的特征值,将所述对数变换后的特征值进行归一化处理,得到归一化后的特征值;基于所述数据集规范对分类字段的特征值按照出现的频率进行统计排序;根据统计排序筛选出频率在前30位的特征值,对筛选后的特征值进行One-hot编码;S3.将所述预处理后的数据进行数据划分,得到划分后的数据集;所述S3中,将所述预处理后的数据进行数据划分,得到划分后的数据集具体包括:对经过预处理的数据按照2:8的比例进行划分,得到训练集和测试集;S4.使用对比学习对划分后得到的训练集进行训练,得到初步训练结果,将所述初步训练结果输入机器学习模型进行训练,获得特征子集;所述机器学习模型为三个基于树的机器学习模型,具体为随机森林模型、额外树模型和XGBoost模型,所述三个基于树的机器学习模型用于对所述对比学习后的训练数据集进行训练,得到特征重要性;所述S4中,使用对比学习对划分后得到的训练集进行训练,得到初步训练结果,具体包括:将所述训练集输入对比学习模型进行学习,将不同的数据进行类别上的区分,得到对比学习后的训练数据集,所述类别分为正常类数据和异常类数据;S5.将所述特征子集传入Inputencoder、Bert和ClassificationHead组成的Transformer模型以及Inputencoder、GPT2.0和ClassificationHead组成的Transformer模型分别进行训练,保存两个网络入侵检测模型,即这两个Transformer模型,记作Model1和Model2,记录所述Model1和Model2的准确率;其中,在Inputencoder组件中将预处理过的数值字段和分类字段进行拼接,得到高维数据特征;通过嵌入层将所述高维数据特征映射到低维连续特征向量空间,输出能够被Bert模型有效处理的特征向量序列,通过Bert模型学习网络流量序列数据的特征;S6.使用所述Model1和Model2分别对划分后得到的测试集进行测试,得到模型的预测值,对所述预测值加权判别后输出分类结果,完成对网络入侵的检测。
全文数据:
权利要求:
百度查询: 广东技术师范大学 基于Transformer的网络入侵检测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。