首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于禁忌搜索算法的大语言模型安全测试方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江大学

摘要:本发明公开了一种基于禁忌搜索算法的大语言模型安全测试方法和装置,包括:根据大语言模型的安全规范,将有害内容进行分类,并针对每类有害内容构建问题示例以及对应的目标内容;将构建的非安全模板作为初始化变量,基于初始化变量并在目标内容用于构建优化目标值的基础上,采用禁忌搜索算法对非安全模板进行全局优化,得到优化后非安全模板;将优化后非安全模板与问题示例组成问题提示输入至大语言模型中经计算得到生成内容,通过关键词判断或自动标签判断来判断生成内容的安全性,这样可以实现对大语言模型的安全测试。

主权项:1.一种基于禁忌搜索算法的大语言模型安全测试方法,其特征在于,包括以下步骤:数据构建:根据大语言模型的安全规范,将有害内容进行分类,并针对每类有害内容构建问题示例以及对应的目标内容;模板优化:将构建的非安全模板作为初始化变量,基于初始化变量并在目标内容用于构建优化目标值的基础上,采用禁忌搜索算法对非安全模板进行全局优化,得到优化后非安全模板;安全测试:将优化后非安全模板与问题示例组成问题提示输入至大语言模型中经计算得到生成内容,通过关键词判断或自动标签判断来判断生成内容的安全性。

全文数据:

权利要求:

百度查询: 浙江大学 基于禁忌搜索算法的大语言模型安全测试方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。