Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜重庆邮电大学吴渝获国家专利权

恭喜重庆邮电大学吴渝获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜重庆邮电大学申请的专利一种文本对抗样本生成方法、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115688801B

龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211376890.7,技术领域涉及:G06F40/30;该发明授权一种文本对抗样本生成方法、设备及介质是由吴渝;秦先进;先兴平设计研发完成,并于2022-11-04向国家知识产权局提交的专利申请。

一种文本对抗样本生成方法、设备及介质在说明书摘要公布了:本发明公开了一种文本对抗样本生成方法、设备及介质,包括基于文本分类模型和雅可比矩阵对文本数据集进行预处理后的文本进行计算定位关键词,构建替换语料库,将关键词与所述替换语料库进行比对,若匹配则采用替换语料库中的替换案例进行替换生成对抗样本;若不匹配则采用预训练模型生成该关键词的替换候选词,采用贪心算法从替换候选词中选取替换词对关键词进行替换并生成对抗样本。本发明提供了一种文本对抗样本生成方法,使用预训练模型生成符合当前语境上下文的多种替换策略和改进现有的替换词搜索方法,解决现有文本白盒攻击中存在的文本对抗样本质量不足和效率太低的问题。

本发明授权一种文本对抗样本生成方法、设备及介质在权利要求书中公布了:1.一种文本对抗样本生成方法,其特征在于,包括如下步骤:获取文本数据集,并对所述文本数据集进行预处理,得到文本;基于文本分类模型和雅可比矩阵对文本进行计算,得到文本中词语的贡献度并通过词语的贡献度定位关键词;其中,按贡献度的大小由高到低进行排序,按序依次标记前n个单词作为输入句子的关键词;其中,通过文本分类模型对所述文本的雅可比矩阵计算词语的贡献度的方法如下: 其中,K表示文本分类y总的类别数,表示第j个类别所对应的置信度,y表示预测类别,xi表示输入词,为词的贡献度,为雅可比矩阵;使用替换成功的案例构建替换语料库,将所述关键词与所述替换语料库的案例进行比对;若所述关键词与所述替换语料库的案例匹配,采用替换语料库中的替换案例进行替换生成对抗样本;若所述关键词与所述替换语料库的案例不匹配,则采用预训练模型生成该关键词的替换候选词,采用贪心算法从替换候选词中选取替换词对关键词进行替换并生成对抗样本;其中,采用贪心算法从替换候选词中选取替换词的方法如下:A、计算使用替换候选词替换前文本的置信值以及使用替换候选词替换后文本的置信值;B、根据步骤A使用替换候选词替换前后文本置信值的变化选择最优候选词;C、使用最优候选词替换掩码获得扰动文本S′;D、使用余弦相似度计算扰动文本S′与未替换之前的文本S的语义相似性,若扰动文本S′的语义相似性在阈值之上,则对抗样本生成成功;若扰动文本S′的语义相似性在阈值之下,则重复步骤A直至扰动文本S′的语义相似性在阈值之上或所有替换候选词使用完毕。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400000 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。