北京邮电大学尚煜茗获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京邮电大学申请的专利一种大语言模型安全防护机制的检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120316781B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510427763.2,技术领域涉及:G06F21/57;该发明授权一种大语言模型安全防护机制的检测方法及系统是由尚煜茗;索攀;罗伟;张熙;郭三川;李朝卓设计研发完成,并于2025-04-07向国家知识产权局提交的专利申请。
本一种大语言模型安全防护机制的检测方法及系统在说明书摘要公布了:本发明提供一种大语言模型安全防护机制的检测方法及系统,方法在检索增强生成框架上执行,黑盒访问权限下使用查询问题的文本作为前缀文本;白盒访问权限下,检索器中编码器编码获得的文本向量构建为嵌入矩阵,计算各文本向量之间的相似度矩阵对各文本向量进行聚类操作,各类别问题集合的聚类中心的文本作为前缀初始文本并进行类别内部优化后获得前缀文本;通过预设开源越狱问题模板构建越狱问题并在问题前后加提示词;前缀文本和后缀文本组合为恶意文本并加入知识数据库;将目标查询问题输入检索器并从知识数据库中检索出包含恶意文本的问题答案,与查询问题共同输入大语言模型,根据输出结果判断大语言模型安全防护机制是否生效。
本发明授权一种大语言模型安全防护机制的检测方法及系统在权利要求书中公布了:1.一种大语言模型安全防护机制的检测方法,其特征在于,所述方法在检索增强生成框架上执行,该方法包括以下步骤: 在禁止向检索器发出检索请求并访问内部参数的黑盒访问权限下使用查询问题的文本作为前缀文本;在允许向检索器发出检索请求并访问内部参数的白盒访问权限下,通过所述检索器中的编码器对多个查询问题的文本进行编码并将获得的文本向量构建为嵌入矩阵,根据预设相似度计算方法计算的各文本向量之间的相似度矩阵对各文本向量进行聚类操作,计算各类别问题集合的聚类中心,将聚类中心的文本作为前缀初始文本并进行类别内部优化后获得前缀文本; 通过预设开源越狱问题模板构建用于触发大语言模型安全防护机制的越狱问题,并在所述越狱问题前后添加用于对所述大语言模型的注意力进行引导的提示词后获得后缀文本; 将所述前缀文本和所述后缀文本进行组合获得用于触发大语言模型安全防护机制的恶意文本并加入知识数据库中; 将目标查询问题输入所述检索器,所述检索器从所述知识数据库中检索出包含恶意文本的预设数量的问题答案,将所述问题答案与所述查询问题共同传输至大语言模型中并输出结果,根据所述结果判断所述大语言模型安全防护机制是否生效。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励