中国科学院自动化研究所刘雨帆获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院自动化研究所申请的专利目标语言模型安全评测方法及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120611386B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511105793.8,技术领域涉及:G06F21/57;该发明授权目标语言模型安全评测方法及电子设备是由刘雨帆;李兵;胡卫明设计研发完成,并于2025-08-08向国家知识产权局提交的专利申请。
本目标语言模型安全评测方法及电子设备在说明书摘要公布了:本发明提供了一种目标语言模型安全评测方法及电子设备,可以应用于网络空间安全技术领域。该方法包括:基于安全等级分类标准,对多个安全领域进行安全等级分类,得到分类结果;针对多个安全等级的每个安全等级,对至少一个安全领域进行测试题库构建,得到测试题库;根据攻击测试题库中至少一个测试题和拒答测试题库中至少一个测试题对目标语言模型进行模型应用安全测试,得到模型应用安全测试结果;基于风险能力测试用例对目标语言模型进行模型功能安全测试,得到模型功能安全测试结果,其中,风险能力测试用例用于测试目标语言模型的功能安全风险;根据模型应用安全测试结果和模型功能安全测试结果,生成目标语言模型的安全评估报告。
本发明授权目标语言模型安全评测方法及电子设备在权利要求书中公布了:1.一种目标语言模型安全评测方法,其特征在于,所述方法包括: 基于安全等级分类标准,对多个安全领域进行安全等级分类,得到分类结果,其中,所述分类结果包括与多个安全等级各自对应的至少一个安全领域; 针对多个所述安全等级的每个所述安全等级, 对至少一个安全领域进行测试题库构建,得到测试题库,其中,所述测试题库至少包括攻击测试题库和拒答测试题库,所述攻击测试题库用于测试目标语言模型面对敏感词伪装攻击时的安全防御能力,所述拒答测试题库用于测试所述目标语言模型面对风险内容提问时的拒答能力; 根据所述攻击测试题库中至少一个测试题和所述拒答测试题库中至少一个测试题对所述目标语言模型进行模型应用安全测试,得到每个所述安全等级的模型应用安全测试结果; 对多个所述安全等级各自的模型应用安全测试结果进行加权,得到目标语言模型整体的模型应用安全测试结果; 基于风险能力测试用例对所述目标语言模型进行模型功能安全测试,得到模型功能安全测试结果,其中,所述风险能力测试用例用于测试所述目标语言模型的功能安全风险,所述风险能力测试用例至少包括数据安全测试用例、模型安全测试用例、系统安全测试用例、合规环境测试用例,所述模型功能安全测试结果包括分别基于所述数据安全测试用例、所述模型安全测试用例、所述系统安全测试用例和所述合规环境测试用例得到的数据安全分数、模型安全分数、系统安全分数和合规安全分数,所述模型安全分数是基于如下操作得到: 根据所述模型安全测试用例中多个模型安全测试子用例,对所述目标语言模型进行安全漏洞测试,得到与每个所述模型安全测试子用例对应的测试结果; 在确定至少一个所述测试结果表征所述目标语言模型存在安全漏洞的情况下,根据至少一个所述安全漏洞产生的受影响系统功能数量、受影响用户数量、受影响数据类型数量,得到漏洞影响范围得分和漏洞影响价值得分,所述漏洞影响范围得分是基于对受影响系统功能数量相对于系统功能总数量的比例、受影响用户数量相对于用户总数量的比例以及受影响数据类型数量相对于数据类型总数量的比例进行加权得到的; 根据安全漏洞的数量、与至少一个所述安全漏洞各自对应的所述漏洞影响范围得分和所述漏洞影响价值得分,得到模型安全分数; 根据所述目标语言模型整体的模型应用安全测试结果和所述模型功能安全测试结果,生成所述目标语言模型的安全评估报告。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院自动化研究所,其通讯地址为:100190 北京市海淀区中关村东路95号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励