Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于域名信息检测DGA域名的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨工业大学(威海)

摘要:本发明提供一种基于域名信息检测DGA域名的方法,包括以下步骤:步骤1构建域名的字符字典和单词字典;步骤2得到域名的字符编码,词汇编码,特征编码;步骤3将字符编码、词汇编码、特征编码作为深度学习算法模型的输入,经过词嵌入,LSTM序列模型,Relu层,Dropout层,SoftMax层的多种操作后,输出深度学习算法模型的三种分类,根据输出的结果判断域名属于哪种类别。此方法不仅可以进一步提高针对基于算术和哈希算法生成的DGA域名的检测精度,也能解决针对基于词典生成的DGA域名的检测精度低,识别误差大等问题。

主权项:1.一种基于域名信息检测DGA域名的方法,其特征是,包括以下步骤:步骤1构建域名的字符字典和单词字典,字符字典由小写字母、数字、连字符等37个字符组成,单词字典的构建过程从基于算术和基于哈希生成的DGA域名、基于词典生成的DGA域名、非DGA域名提取域名的二级域名中,将二级域名分词,得到三种类别的域名的分词结果,分别统计三种类别的分词结果中词汇的出现次数,并从高到低排序,单词字典是由从三种类别中筛选词汇组成;步骤2得到域名的字符编码,词汇编码,特征编码,根据字符字典对域名的二级域名进行编码得到域名的字符编码,根据单词字典将域名的分词结果编码得到域名的词汇编码,从域名中提取特征组成域名的特征编码;步骤3将字符编码、词汇编码、特征编码作为深度学习算法模型的输入,经过词嵌入,LSTM序列模型,Relu层,Dropout层,SoftMax层的多种操作后,输出深度学习算法模型的三种分类,根据输出的结果判断域名属于哪种类别;所述步骤2中得到域名的字符编码,词汇编码,特征编码的具体步骤如下:步骤2.1根据字符字典对域名的二级域名进行编码,得到域名的字符编码;步骤2.2提取域名的二级域名,对二级域名分词,根据单词字典,将域名的分词结果编码,如果分词中不在单词字典的中的词汇,以编码0代替,得到域名的词汇编码;步骤2.3计算域名中的特征,从域名中提取特征组成域名的特征编码,域名中的特征包括域名长度、域名元音字符比例、域名分词后单词个数、域名分词后单词长度小于4的比例和域名分词后单词平均长度;步骤2.4三种编码分别统一编码长度,词汇编码的长度设置为6位,字符编码的长度设置为24位,特征编码的长度为5位,针对词汇编码和字符编码,如果编码超出了设置的指定位数,则采取截断编码前部的方式,如果编码不足设置的指定位数,则在编码的前部补0,使编码的位数等于设置的指定位数;步骤2.5将特征编码进行MinMax归一化处理,消除特征编码中的量纲。

全文数据:

权利要求:

百度查询: 哈尔滨工业大学(威海) 基于域名信息检测DGA域名的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。