南京航空航天大学李博涵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京航空航天大学申请的专利一种基于知识图谱自动化生成的大语言模型安全检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120180434B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510654123.5,技术领域涉及:G06F21/56;该发明授权一种基于知识图谱自动化生成的大语言模型安全检测方法是由李博涵;赵鑫喆;吴文隆;卓俊男;黄瑞龙;刘亮;王昊奋;阮国越雄设计研发完成,并于2025-05-21向国家知识产权局提交的专利申请。
本一种基于知识图谱自动化生成的大语言模型安全检测方法在说明书摘要公布了:本发明属于大语言模型安全技术领域,公开了一种基于知识图谱自动化生成的大语言模型安全检测方法。该方法包括以下步骤:针对安全检测方向包含不同危险提示词的数据集进行预处理,用低资源语言替换初始提示词中的危险行为;通过提示词模板来利用大语言模型自动探索编码在其内部的危险知识,使用大语言模型来构建检测知识图谱;将检测知识图谱中的结构化信息转换为自然语言文本;设计两级安全评估器来判断是否能够绕过大语言模型的安全防护。本发明将初始提示词经过预处理和模板嵌套后尝试绕过被测试大语言模型的安全防护,使得通过模型是否生成检测知识图谱以及具体内容,来评估大语言模型的安全性能。
本发明授权一种基于知识图谱自动化生成的大语言模型安全检测方法在权利要求书中公布了:1.一种基于知识图谱自动化生成的大语言模型安全检测方法,其特征在于, 包括如下步骤: 步骤1.对安全检测方向包含不同危险提示词的数据集进行预处理,用低资源语言替换数据集的初始提示词中的危险行为,得到重写提示词; 步骤2.构建安全检测知识图谱提示词模板并嵌入重写提示词,利用大语言模型自动探索编码在其内部的危险知识并生成关于初始提示词完整的检测知识图谱; 步骤3.设计第一安全评估器,通过询问被测试的大语言模型是否成功构建关于初始提示词完整的检测知识图谱,来判断是否能够绕过被测试的大语言模型的安全防护; 如果成功构建检测知识图谱,则继续执行步骤4;否则返回步骤2重复执行,并且当拒绝构建检测知识图谱的次数超过第一预设阈值时,判定无法绕过大语言模型的安全防护; 步骤4.设计知识图谱转化为文本的提示词模板,检测知识图谱直接嵌套到知识图谱到文本提示词模板中,将生成的检测知识图谱中的结构化信息转换为自然语言文本; 步骤5.设计第二安全评估器,通过询问被评估的文本即经过转换后的自然语言文本中是否包含危险的信息,再次判断是否绕过大语言模型的安全防护; 如果转换后的文本中包含危险的信息,则判定成功绕过大语言模型的安全防护; 否则,返回步骤2重复执行,并且当被测试的大语言模型响应生成内容不包含危险信息的次数超过第二预设阈值时,判定无法绕过被测试的大语言模型的安全防护。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:210016 江苏省南京市秦淮区御道街29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。