首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于Seq2Seq模型的恶意代码同源分析方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司

摘要:本发明公开了一种基于Seq2Seq模型的恶意代码同源分析方法及装置。基于Seq2Seq模型的恶意代码同源分析方法包括:收集恶意代码样本,并获取每个恶意代码样本的汇编指令序列;构建seq2seq模型,并利用所有汇编指令序列训练seq2seq模型,以获取恶意代码同源分析模型;将待测恶意代码的汇编指令序列输入恶意代码同源分析模型,以确定待测恶意代码所属族群。本发明通过基于Seq2Seq模型可以实现恶意代码的自动同源分析,不需要人为标注,而且该模型能够接受任意长度的输入序列,不需要对样本的指令序列做截取或补充处理,能更准确地提取代码的语义信息。

主权项:1.一种基于Seq2Seq模型的恶意代码同源分析方法,其特征在于,包括:收集恶意代码样本,并获取每个所述恶意代码样本的汇编指令序列;构建seq2seq模型,并利用所有汇编指令序列训练所述seq2seq模型,以获取恶意代码同源分析模型;将待测恶意代码的汇编指令序列输入所述恶意代码同源分析模型,以确定所述待测恶意代码所属族群;所述构建seq2seq模型,并利用所有汇编指令序列训练所述seq2seq模型,包括:构建所述seq2seq模型的输入层,以用于输入汇编指令序列;构建所述seq2seq模型的词嵌入层,以用于将所述输入层获取的汇编指令转化为词向量;构建所述seq2seq模型的隐藏层,以用于基于所述词向量,计算分类概率,所述隐藏层包括编码-解码结构的循环神经网络;构建所述seq2seq模型的输出层,以用于输出所述分类概率;利用所有汇编指令序列,采用梯度下降法,训练所述seq2seq模型;所述隐藏层,用于:基于公式1-3,将xi和h0,i输入编码部分循环神经元的当前单元,以获得h0,i+1,并将所述h0,i+1作为记忆信息输入到下一单元,依次循环,最后一个单元输出整个汇编指令序列的记忆信息C,z1,i=wx·xi+bx公式1, h0,i+1=tanhz1,i+z2,i公式3,其中,xi为编码部分输入的m个汇编指令的词向量xi,i∈[0,m-1],wx和分别为xi和h0,i的隐藏层权重,bx和为偏移,h0,0初始化获得;基于公式4-8,将yj和h1,j输入解码部分循环神经元的当前单元,以获得h1,j+1,并将所述h1,j+1作为记忆信息输入到下一单元,依次循环,以收集所有y1、y2、...yj+1......yp,y0=C公式4,v1,j=wy·yj+by公式5, h1,j+1=tanhv1,j+v2,j公式7, 其中,j∈[0,p-1],p为族群数量,wy和分别为yj和h1,j的隐藏层权重,by和为偏移,h1,0初始化获得;所述隐藏层的损失Li根据公式9计算获得:Lj=-logyj公式9。

全文数据:

权利要求:

百度查询: 北京天融信网络安全技术有限公司 北京天融信科技有限公司 北京天融信软件有限公司 基于Seq2Seq模型的恶意代码同源分析方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。