买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南通大学
摘要:本发明提供了一种基于对偶学习的shellcode代码和注释生成方法,包括以下步骤:1搜集来自shellstorm和ExploitDatabase的shellcode语料库;2将shellcode注释生成和shellcode代码生成这两个任务形式化为一个对偶学习问题,并通过为输入添加前缀来区分两个任务,使用浅层的Transformer进行同步学习,实现知识共享,提高训练模型的性能和泛化能力;3提出了一种改进自注意力计算的归一化方法Adjust_QKNorm,以使Transformer适应低资源任务;4提出一个基于规则的修复组件。本发明的有益效果为:有利于软件的开发和维护,生成的高质量注释和代码可以帮助提高开发人员的工作效率,进而提高软件质量。
主权项:1.基于对偶学习的shellcode代码和注释生成方法,其特征在于,包括以下步骤:1搜集shellstorm和ExploitDatabase上从2000年到2020年的shellcode语料库,设定其格式为代码,注释,使用一个模型学习对偶任务,通过交换输入和输出转换语料库,并通过添加前缀区分两个任务;2将shellcode注释生成和shellcode代码生成两个任务形式化为一个对偶学习问题,使用浅层的Transformer进行同步学习,用于知识共享和训练模型的性能和泛化能力;3提出改进自注意力计算的归一化方法Adjust_QKNorm,使Transformer适应低资源任务;4提出一个基于规则的修复组件,用于提高自动生成shellcode的准确性;所述步骤3中使用Adjust_QKNorm改进自注意力计算,具体包括如下步骤:3-1注意力函数是基于三个矩阵同时计算出的:Q查询,K键和V值,从矩阵Q和K的对应平均值中减去最后一个维的值,使得这个维上所有元素的和等于零;3-2接着对Q和K进行L2归一化处理;3-3点积得到的结果表示为Q和K的余弦相似度计算,并且不需要除以√dk;3-4通过与一个可学习参数g相乘来训练模型;所述步骤4中提出一个基于规则的修复组件,具体内容如下:shellcode中的汇编语句由标签、指令和操作数组成,出现在操作数位置上的值分为三类,当生成的shellcode与注释存在操作数位置上值的不一致时,从注释中提取正确的值,并使用这个值更新生成的shellcode,以此提高自动生成shellcode的准确性,如果根据自然语言描述生成shellcode时发现地址存在不一致,从注释中提取正确的地址,并使用这个地址更新生成的shellcode。
全文数据:
权利要求:
百度查询: 南通大学 基于对偶学习的shellcode代码和注释生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。