一种自监督的大模型恶意指令检测方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国电子科技网络信息安全有限公司;中国电子科技集团公司第三十研究所

摘要：本发明公开了一种自监督的大模型恶意指令检测方法及系统，涉及网络安全领域，大模型恶意指令检测系统由用户终端、防火墙、指令特征提取器、恶意指令检测器、目标大模型、指令样本生成器和指令筛选器通过网络连接而成的，并以此提出的一种检测方法。本发明，通过利用未标注指令数据中的潜在信息，可以在不显著增加数据标注成本的情况下，有效提升模型的恶意指令检测性能和泛化能力，从而构建更为鲁棒的恶意指令检测模型，支持及时抵御恶意指令攻击。

主权项：1.一种自监督的大模型恶意指令检测系统，其特征在于，包括：用户终端、防火墙、指令特征提取器、恶意指令检测器和目标大模型；所述用户终端通过请求大模型应用服务端口对目标大模型进行提问，通过防火墙规则筛选掉无效或者未授权的访问；所述指令特征提取器用于提取提问的输入文本的指令特征；所述恶意指令检测器基于指令特征提取器提取出的指令特征，进行恶意指令检测，并将检测结果传递至目标大模型，由目标大模型产生实际的用户期望的大模型输出或者恶意用户警告信息；还包括：指令样本生成器和指令筛选器；所述指令特征提取器还能够从用户历史访问记录库提取出指令特征，经指令特征提取器提取出的指令特征均储存在指令特征库中；所述指令样本生成器能够基于规则引擎和指令特征库，自动生成特定恶意指令或者语义相近形式不同的正常指令；所述指令筛选器用于筛选指令样本生成器生成的指令，并将筛选结果加入到指令样本库中，用于恶意指令检测器的训练和更新；所述恶意指令检测器内部加载有基于融合特征的深度神经恶意指令检测模型，深度神经恶意指令检测模型，包括：特征融合网络、恶意指令判别网络、模型更新机制；特征融合网络能够融合不同维度的指令样本特征；恶意指令判别网络能够将融合后的特征作多分类，识别其是否为恶意指令，输出恶意指令的类别；模型更新机制可以实现在不影响业务工作的前提下，实现模型的增量更新；所述指令样本生成器内部维护了一个基于规则引擎的指令生成模块；在规则引擎中定义了两类指令生成规则模板，一类是恶意指令规则样本生成，目的是通过正常用户指令，生成带有特定类别的恶意指令；另外一类是中性规则样本生成，目的是在不改变原有指令语义的前提下，生成一批跟原有指令功能相同但字符形式不同的指令，扩充指令的样本数量；所述指令筛选器具有开源通用大模型，通过开源通用大模型进行指令筛选；所述指令特征提取器的提取方法如下：首先对指令进行切分，得到指令片段；再对指令片段进行预处理；所述预处理，包括：去噪声、去非法字符、去重复、标准化；最后针对预处理后的指令片段，进行字符串特征和词语特征提取，使用自然语言处理工具完成指令特征提取；所述指令样本生成器的生成过程如下：从指令特征库中获取指令片段以及对应的特征向量；根据指令样本生成的类别需求，随机选择指令生成规则，根据指令生成规则执行的前置条件，选取指令片段的某一行为规则执行的靶点，若没有符合的靶点，则更换指令生成规则，假如所有的指令规则都执行完，也没有找到靶点，则换下一个指令片段继续执行；在靶点，执行指令生成规则，生成相应类别的恶意指令样本或正常指令样本；从而生成恶意指令样本集合或正常指令样本集合；将恶意指令样本集合和正常指令样本集合按照样本类别打上标签，加入到指令安全性检测样本库中；所述指令筛选器的筛选过程如下：从指令安全性检测样本库获取构造的恶意指令样本、正常指令样本；将恶意指令样本、正常指令样本通过提示词模板，输入到开源通用大模型中，收集开源通用大模型的检测结果；针对输入是正常指令样本，假设开源通用大模型的检测结果多数没有检测到恶意性，则生成的正常指令样本为正确标签样本，加入到指令样本库；否则丢弃掉；针对输入是恶意指令样本；假设开源通用大模型的检测结果多数检测到特定的恶意类别，则生成的恶意指令样本为正确标签样本，加入到指令样本库；否则丢弃掉；所述特征融合网络利用了字符级别、词级别、句子级别三类特征，使用嵌入方法将文本转化为向量形式；定义表示3种特征融合网络；是特征融合网络的每一层；是特征融合网络的输入向量，包括：字符级嵌入特征向量、词级别嵌入特征向量和句子嵌入特征向量；用代表输入到层的向量；是超参数；是层的输出；表示层的权重；是层的偏移量；神经网络的激活函数采用变种的线性整流函数LeakyReLU；则特征融合网络向前传递公式为：其中：表示特征融合网络的第0层输出；表示激活函数的输出，即当其大于零时，输出原函数的值，否则，输出0；定义是恶意指令判别网络的每一层，代表输入到层的向量，是层的输出，表示层的权重，是层的偏移量，神经网络的激活函数同样采用变种的线性整流函数LeakyReLU，是恶意指令判别网络的输出函数，由于是多分类问题，采用softmax函数；则恶意指令判别网络向前传递公式为：其中：表示融合了多层神经网络的输入向量；表示对第1层的线性组合结果，同理；表示第4层的输出，应用了softmax函数；表示输出层中的第个神经元的索引；表示自然常数；表示恶意指令判别网络中第个神经元的线性组合结果；表示在输出层中的某一个神经元的索引；表示输出层中神经元的总数；表示第个神经元的线性组合结果；用表示训练数据的标签，表示恶意指令判别网络的输出标签；则使用寻找参数最大值的索引，作为恶意指令检测器的输出；基于融合特征的深度神经恶意指令检测模型在训练过程中，采用的交叉熵损失函数如下：其中：表示是交叉熵损失函数，用于评估分类模型的预测输出与真实标签之间的匹配程度；表示数据样本的索引，即表示每个恶意指令样本；表示取最大值的索引，用于选择预测概率最高的类别作为模型的最终输出。

全文数据：

权利要求：

百度查询：中国电子科技网络信息安全有限公司中国电子科技集团公司第三十研究所一种自监督的大模型恶意指令检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：电信网元实时处理方法、装置、设备、介质及程序产品

下一篇：一种炉头自动生产线及其工艺

相关技术

电信网元实时处理方法、装置、设备、介质及程序产品

一种炉头自动生产线及其工艺

超临界CO₂腐蚀测试系统的样品加载装置

化合物、有机电致发光元件用材料、有机电致发光元件和电子设备

一种用于多弯曲半径的数控弯曲连接装置及使用方法

一种弹性卷材的放卷换卷机构

一种膨化食品加工用粉碎装置

一种热网加热器换热管泄漏在线定位系统及方法

一种高线吐丝管安装精确定位装置

一种玻璃瓶裂纹检测装置

路径规划方法、系统、设备及计算机可读存储介质

储能变流器及储能系统

指令相关技术

指令执行方法与存储装置_合肥开梦科技有限责任公司_202410953148.0

处理装置、指令处理方法、设备及存储介质_北京奕斯伟计算技术股份有限公司_202410969715.1

跳转指令目标地址定位装置及CPU核_剑虎医疗科技(苏州)有限公司_202411199194.2

一种改变指令周期的方法和系统_湖南进芯电子科技有限公司_202411009481.2

指令流文件生成方法、装置、电子设备及可读介质_北京开源芯片研究院_202411112120.0

一种基于内核数据重构的异构指令集程序加载方法_北京麟卓信息科技有限公司_202411314370.2

用于乱序多发射处理器的指令处理方法及装置_芯来智融半导体科技(上海)有限公司_202410918102.5

一种多模态指令指导的蛋白质设计方法和装置_浙江大学_202411091775.4

一种自监督的大模型恶意指令检测方法及系统_中国电子科技网络信息安全有限公司_202411267797.1

一种独立业务指令的多节点处理方法及系统_珠海盈米基金销售有限公司_202411420031.2

检测相关技术

检测装置及检测方法_北京机科国创轻量化科学研究院有限公司_202411044408.9

检测装置及检测系统_矽电半导体设备(深圳)股份有限公司_202410959491.6

螺纹检测设备、检测系统、加工系统及检测方法_北京好运达智创科技有限公司_202411220151.8

压板电压检测装置和检测方法_广东电网有限责任公司_202410979881.X

导热系数检测装置及检测系统_河北光兴半导体技术有限公司_202322820137.9

PCBA检测装置及检测方法_苏州品嘉电子科技有限公司_202411196245.6

潮位检测装置与潮位检测方法_深圳市朗诚科技股份有限公司_202411055620.5

检测装置和磨床在线检测系统_法奥意威(苏州)机器人系统有限公司_202411187254.9

焊丝刚性检测装置及其检测方法_哈焊所华通(常州)焊业股份有限公司_202311287704.7

检测系统_南微医学科技股份有限公司_202420767427.3

恶意相关技术

恶意代码图像分类方法和系统_中国人民解放军空军工程大学_202411003652.0

恶意文件检测方法、装置、设备及存储介质_西安四叶草信息技术有限公司_202411204669.2

一种基于时间戳的恶意代码防护方法、存储介质及设备_北京安天网络安全技术有限公司_202411430500.9

一种自监督的大模型恶意指令检测方法及系统_中国电子科技网络信息安全有限公司_202411267797.1

基于大语言模型恶意域名访问的识别方法_威海蓝海银行股份有限公司_202411062447.1

一种恶意软件的检测方法、装置、设备及产品_西安电子科技大学杭州研究院_202411000175.2

一种恶意软件隐藏行为检测方法、系统、设备和存储介质_中国人民大学_202410952814.9

一种区块链恶意攻击实时监测方法、系统、程序产品_西安交通大学_202410923366.X

一种基于多模态特征融合的恶意软件检测分类方法及系统_广东工业大学_202411031739.9

一种基于大数据挖掘分析的恶意代码智能检测方法及系统_华能庆阳煤电有限责任公司_202410838366.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种自监督的大模型恶意指令检测方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务