买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华中科技大学;支付宝(杭州)信息技术有限公司
摘要:本发明公开了一种基于大模型特征生成的第三方恶意包检测方法,属于程序包检测领域,该方法利用大语言模型来指导第三方包恶意代码片段的识别和特征的生成,自动生成特征集,不依赖于专家定义的特征,能够有效地克服了现有基于机器学习的检测器的缺点,使得特征集更能反映恶意样本与良性样本的差异,拓展性更强;采用更新提示轮询的方式并构建恶意片段集,使准确度得到提高;同时能显著降低恶意包检测的误报率和漏报率,并给出恶意代码位置。
主权项:1.一种基于大模型特征生成的第三方恶意包检测方法,其特征在于,包括:训练阶段:将训练包输入至大语言模型进行恶意代码识别以获取所述训练包中的恶意代码,提取所述恶意代码的特征构建特征集;其中,所述训练包为第三方恶意包;生成所述训练包对应的抽象语法树AST,遍历AST的节点以确定与所述特征集中的特征对应的语法结构,对与所述语法结构对应的代码段进行编码得到所述恶意代码的特征向量;将所述特征向量输入至机器学习模型进行监督训练;应用阶段:生成待检测第三方包对应的抽象语法树AST,遍历AST的节点以确定与所述特征集中的特征对应的语法结构,对与所述语法结构对应的代码段进行编码得到待检测特征向量,将其输入至训练好的机器学习模型,得到检测结果;所述大语言模型在预设提示下识别所述训练包中的恶意代码;其中,所述预设提示为:确定恶意代码片段,分析其恶意行为,并给出所述恶意行为的置信度;所述大语言模型采用迭代查询的方式在预设提示下识别所述训练包中的恶意代码;其中,在进行第t+1次查询时,将第t次查询的识别结果以注释的方式增加至所述预设提示中;所述提取所述恶意代码的特征构建特征集,包括:保留满足置信度要求的恶意行为对应的恶意代码;分别提取各恶意行为对应的恶意代码中的关键字作为所述各恶意行为的类型标识;将各恶意行为对应的恶意代码中出现频率最高的代码片段作为所述各恶意行为对应的恶意代码的特征,得到特征集。
全文数据:
权利要求:
百度查询: 华中科技大学 支付宝(杭州)信息技术有限公司 一种基于大模型特征生成的第三方恶意包检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。