买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京安天网络安全技术有限公司
摘要:本发明公开了一种恶意代码识别方法及装置,属于网络安全技术领域。方法包括:获取客户端中待检测对象的二进制原始数据;所述待检测对象至少包括静态文件和或动态行为;将所述二进制原始数据输入至预先训练完成的字节嵌入模型中,并获取所述字节嵌入模型针对所述二进制原始数据进行字节编码嵌入后输出的字节嵌入向量;将所述字节嵌入向量发送给云端,以由云端对所述字节嵌入向量进行恶意性识别,并接收云端反馈的恶意性识别结果。本发明不仅数据传输量降低,且传输的字节嵌入向量难以反推出原始数据内容,从而可以降低用户隐私被泄露的风险,提高了数据安全性。
主权项:1.一种恶意代码识别方法,其特征在于,所述方法包括:获取客户端中待检测对象的二进制原始数据;所述待检测对象至少包括静态文件和或动态行为;将所述二进制原始数据输入至预先训练完成的字节嵌入模型中,并获取所述字节嵌入模型针对所述二进制原始数据进行字节编码嵌入后输出的字节嵌入向量;将所述字节嵌入向量发送给云端,以由云端对所述字节嵌入向量进行恶意性识别,并接收云端反馈的恶意性识别结果;在将所述二进制原始数据输入至预先训练完成的字节嵌入模型中之前,还包括:在所述二进制原始数据超出所述字节嵌入模型的训练尺寸时,确定所述二进制原始数据的格式,针对格式为可执行文件的二进制原始数据,确定可执行文件的特征区域,将每一个特征区域的二进制原始数据分别作为单独分片的二进制原始数据,非特征区域的二进制原始数据按照所述训练尺寸进行拆分,得到多个分片的二进制原始数据;针对其他格式的二进制原始数据,则按照所述训练尺寸进行拆分,得到多个分片的二进制原始数据;所述字节嵌入模型为第一LLM模型;云端在进行恶意性识别时采用第二LLM模型实现;所述第一LLM模型和所述第二LLM模型具有相同模型结构,且采用联合训练方式进行训练得到;所述联合训练方式包括:获取多个样本;所述样本包括:样本二进制原始数据及其恶意性识别结果;针对每一个样本均执行:将该样本中的样本二进制原始数据和第一提示词作为所述第一LLM模型的输入,所述第一提示词用于指示所述第一LLM模型对该样本二进制原始数据进行字节编码嵌入,并获取所述第一LLM模型输出的样本字节嵌入向量;将该样本字节嵌入向量和第二提示词作为所述第二LLM模型的输入,所述第二提示词用于指示所述第二LLM模型对该样本字节嵌入向量进行恶意性识别,并将该样本的恶意性识别结果作为所述第二LLM模型的输出;利用所述第二LLM模型的输出结果对所述第二LLM模型中的第二模型参数和所述第一LLM模型中的第一模型参数进行反向传播。
全文数据:
权利要求:
百度查询: 北京安天网络安全技术有限公司 恶意代码识别方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。