针对大语言模型转述攻击的基于句子语义的水印方法

导航：龙图腾网> 最新专利技术> 针对大语言模型转述攻击的基于句子语义的水印方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：电子科技大学(深圳)高等研究院

摘要：本发明公开了一种针对大语言模型转述攻击的基于句子语义的水印方法，在生成式大语言模型生成新的词语标记时，先根据输入标记序列生成词汇表中每个词语标记的对数概率，采用语义嵌入模型得到当前输入标记序列的语义嵌入向量，并将其投影至预先设置的向量空间，得到对应的投影语义嵌入向量，从中选取最小的若干元素序号构成绿色列表，对于词汇表中每个词语标记，如果属于绿色列表则根据预设的水印强度对其对数概率进行修正，如果不属于绿色列表则当前对数概率即为修正后的对数概率，根据修正后的对数概率选择新的词语标记，如此循环，生成水印文本。本发明通过生成绿色列表并指导新词语标记的生成逻辑，以抵抗对于大语言模型的转述攻击。

主权项：1.一种针对大语言模型转述攻击的基于句子语义的水印方法，其特征在于包括：S1：根据实际需要设置分词器、生成式大语言模型、词汇表和语义嵌入模型，其中：分词器包括正向处理过程和逆向处理过程，正向处理过程是对输入文本进行分词并得到每个词语对应的标记，逆向处理过程是根据词语标记生成输出文本；词汇表用于保存词语标记，由分词器基于预先设置的词语集生成，记词汇表大小为V；生成式大语言模型用于根据输入标记序列生成概率分布，概率分布中包括词汇表中每个词语标记对应的对数概率pv，v＝1,2,…,V，用于对词语标记进行选择；语义嵌入模型用于计算文本对应的语义嵌入向量；S2：初始化输入文本，采用分词器的正向处理过程得到对应的输入标记序列T＝[t0,…,tn-1]，其中ti′表示输入文本中第i′个词语标记，i′＝0,1,…,n-1，n表示输入文本的初始长度，初始化绿色列表G为空，设置一个向量空间PV，其维度为词汇表的大小V；S3：初始化新增词语序号i＝n，输入标记序列X＝T；S4：将输入标记序列X输入生成式大语言模型，得到词汇表中每个词语标记的对数概率pi,v；S5：判断绿色列表G是否为空或标记ti-1是否为句子分隔符，如果有任意一项满足，则进入步骤S6，如果均不满足，进入步骤S8；S6：采用语义嵌入模型得到当前输入标记序列X的语义嵌入向量，并将其投影至预先设置的向量空间PV，得到维度为V的投影语义嵌入向量eX；S7：从投影语义嵌入向量eX中选择前K个最小的元素，记录其元素序号dk，k＝1,2,…,K，将K个序号dk构成绿色列表G；S8：采用如下公式对步骤S4中生成的对数概率进行修正，得到修正后的对数概率pi,v：其中，δ表示预设的水印强度；S9：采用预设的采样方法根据对数概率从词汇表中采样得到某个词语标记xi，将其添加至输入标记序列X后，更新输入标记序列X＝X,xi；S10：判断是否i＜m，m表示预设的新增词语数量，如果是，进入步骤S10，否则进入步骤S11；S11：令i＝i+1，返回步骤S4；S12：分词器采用其逆向处理过程对输入标记序列X进行转换，将得到的文本作为水印文本进行发送。

全文数据：

权利要求：

百度查询：电子科技大学(深圳)高等研究院针对大语言模型转述攻击的基于句子语义的水印方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：内走线鱼竿的摇柄隐藏结构

下一篇：一种线性工程快速出图方法及系统

相关技术

内走线鱼竿的摇柄隐藏结构

一种线性工程快速出图方法及系统

一种BODIPY类化合物、制备方法及其应用

一种精密铜铝铸件切割装置

印制电路板、器件焊接检测方法、装置及电子设备

App自测试系统、方法、电子设备及存储介质

一种粗氨气净化及制取液氨的装置及方法

叔丁醇的制造方法

一种商用电动汽车充电效率提升的装置及方法

一种底水回掺工艺流程

电信网元实时处理方法、装置、设备、介质及程序产品

点云配准方法、装置、存储介质、计算机设备和程序产品

句子相关技术

一种融合双语言模型和句子检测的文本生成方法_广州大学_202111499830.X

基于语义显著性的句子语义检索方法及系统_北京深言科技有限责任公司_202410250262.7

针对大语言模型转述攻击的基于句子语义的水印方法_电子科技大学(深圳)高等研究院_202410926631.X

基于压缩空间句子选择的目标新闻话题摘要方法_昆明理工大学_202210449431.0

一种联合字符感知和句子感知的小样本实体识别方法_南华大学_202210117815.2

句子推荐方法、装置及计算机可读存储介质_广州视源电子科技股份有限公司_202011480795.2

一种基于对比学习的深度学习中文句子文本情感分析方法_桂林电子科技大学_202410851594.0

一种基于知识图谱的深度学习中文句子文本情感分析方法_桂林电子科技大学_202410851711.3

用于解释自然语言句子的神经网络_因韦克有限责任公司_201980075386.3

一种句子向量模型训练方法_临沂中科好孕智能技术有限公司_202110766647.5

攻击相关技术

一种基于异构图在APT攻击早期识别预警方法及系统_东南大学_202410996863.2

联盟链重放攻击的测试方法、装置、电子设备及存储介质_国家计算机网络与信息安全管理中心_202111323148.5

一种Web攻击报告生成方法、装置、设备及计算机介质_杭州安恒信息安全技术有限公司_202011040471.7

一种基于RDP沙箱的防攻击方法、系统_杭州默安科技有限公司_202411126353.6

基于梯度聚类和距离过滤的联邦学习拜占庭攻击防御方法_西北工业大学_202410992188.6

网络攻击方案推荐方法、装置、电子设备以及存储介质_鹏城实验室_202410877244.1

一种基于电信号的变流器系统网络攻击检测方法及系统_湖南大学_202411161651.9

基于行为特征的持续性攻击检测方法及装置、介质、设备_浪潮云信息技术股份公司_202410958235.5

攻击环境下降低无用信息比重的鲁棒性推荐方法及系统_山东师范大学_202111462560.5

一种流攻击图模型的实物保护系统攻防效能评估方法_西安电子科技大学杭州研究院_202411058517.6

转述相关技术

一种转述文本生成方法、装置、介质及设备_浙江香侬慧语科技有限责任公司_202111209549.8

一种基于语音模型的方言转述方法及相关装置_深圳市易平方网络科技有限公司_202111151990.5

基于机器翻译的无监督转述文本生成方法、装置及介质_浙江香侬慧语科技有限责任公司_202111211108.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

针对大语言模型转述攻击的基于句子语义的水印方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务