中关村融智企业管理创新推广中心;北京大船科技有限公司路明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中关村融智企业管理创新推广中心;北京大船科技有限公司申请的专利一种基于思维链的网络安全知识推理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119514678B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411524822.X,技术领域涉及:G06N5/04;该发明授权一种基于思维链的网络安全知识推理方法是由路明;张小明;路新喜;王杜娟;余斌;徐林峰设计研发完成,并于2024-10-30向国家知识产权局提交的专利申请。
本一种基于思维链的网络安全知识推理方法在说明书摘要公布了:本发明属于计算机科学技术领域,具体涉及一种基于思维链的网络安全知识推理方法,所述方法包括以下步骤:S1:筛选网络安全学术资料,将筛选得到的资料进行统一格式化处理,得到用于大模型预训练的网络安全数据语料;S2:进行网络安全语料训练;利用PEFT技术与FlashAttention2技术对基础大模型进行网络安全语料训练;S3:利用当前的思维链提示理论知识进行思维链提示样例设计;S4:思维链提示方法的设计。本发明能够在结合了现有大模型的基础上,将思维链的零样本推理与少样本推理方法相结合,训练精调一个性能较为优秀的网络安全大模型。
本发明授权一种基于思维链的网络安全知识推理方法在权利要求书中公布了:1.一种基于思维链的网络安全知识推理方法,其特征在于:所述方法包括以下步骤: S1:筛选网络安全学术资料,将筛选得到的资料进行统一格式化处理,得到用于大模型预训练的网络安全数据语料; S2:进行网络安全语料训练; 利用PEFT技术与FlashAttention2技术对基础大模型进行网络安全语料训练; 所述S2中,网络安全语料训练的具体步骤如下: S21:首先利用PEFT技术进行预训练程序编写,对预训练语料进行解析,定义预训练过程中的工作,根据本地的配置调整数据集路径、模型配置和参数; S22:随后进行模型与tokenizer的初始化,加载预训练的模型和tokenizer,并进行数据预处理,令模型对输入的文本数据进行标记化和分块处理,以准备训练数据,接着对于模型配置再次进行优化; S23:预训练代码对模型进行量化和优化设置,匹配模型词汇表大小和tokenizer,初始化模型; S24:最后执行训练,包括继续训练、评估指标和自动保存中间训练结果; S25:在预训练过程中,使用FlashAttention2技术进行训练加速优化,将自注意力计算的时间复杂度从On2降为On; 预训练程序会接收终端输入的预训练参数,程序设定终端输出的预训练日志; 再检查相应的文件路径中是否保存有上次预训练未完成时留下的checkpoint: 若有,则加载相应的checkpoint,并继续执行上次未完成的预训练; 若无,则开始进行模型的初始化,对预训练的语料先进行分词处理,再重新连接经过分词处理后的预训练语料中的所有文本,以固定长度划分文本为文本块; 完成相关的初始化工作后,启用梯度checkpoint,用于在预训练过程中保存重要的节点,随后初始化训练器Trainer,开始执行预训练程序,并在终端中输出预训练日志; S3:利用当前的思维链提示理论知识进行思维链提示样例设计; S31:首先将通过人工构造网络安全领域的思维链问题样例; S32:随后利用chatGPT生成思维链回答样例,将人工的提问与chatGPT的回答结合成一个完整的思维链提示样例,重复此过程构造一定量的思维链提示样例; S33:然后进行思维链提示样例预实验筛选出少量且有效的思维链提示样例用于后续使用; S4:思维链提示方法的设计。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中关村融智企业管理创新推广中心;北京大船科技有限公司,其通讯地址为:100191 北京市海淀区中关村南大街乙12号院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。