首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种生成黑盒循环神经网络对抗样本的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京大学

摘要:本发明涉及循环神经网络的分析和解释技术领域,涉及自然语言处理,提供了一种生成黑盒循环神经网络对抗样本的方法,包括以下步骤:提取加权有穷自动机、初始化候选样本集合、预测数据、计算适应度数值、判断目标阈值、生成对抗样本。基于本发明进行自然语言文本的对抗数据生成,从目标黑盒循环神经网络提取加权有穷自动机作为自然语言文本的对抗样本生成的向导,提供了代理模型指导,增大了对抗样本生成的成功率和效率,采用本发明用于在机器学习即服务场景中的黑盒循环神经网络对抗样本生成,增大了对抗样本生成的成功率和效率,有效的减少了问询次数,降低服务问询成本。

主权项:1.一种生成黑盒循环神经网络对抗样本的方法,其特征在于,包括以下步骤:提取加权有穷自动机:对目标黑盒循环神经网络进行剖析,具体是对所述目标循环神经网络的输出层状态中处理训练序列数据的转移轨迹的剖析;随后逐步构建所述目标循环神经网络对应的加权有穷自动机的各个组件,包括:根据所述训练序列数据,构建字母表;基于聚类算法和离散划分数目得到初始离散状态集合并通过n-state合成策略获取加强上下文信息的离散状态集合;基于获取的所述目标循环神经网络的具体转移轨迹,得到对应所述字母表中的每个字母的离散状态间转移矩阵;建立加权有穷自动机的初始向量;基于所述加权有穷自动机的各个抽象状态上的标签向量构建所述加权有穷自动机的最终向量;从而完成了所述加权有穷自动机的提取;初始化候选样本集合:基于算法的类型设定算法的样本数据量,根据所述样本数据量进行迭代,得到初始化后的候选对抗样本数据集合;预测数据:利用提取的所述加权有穷自动机,进一步设计适应度函数;并对当前样本进行预测推理,根据所述加权有穷自动机的预测输出向量,以供下一步适应度函数值的计算;计算适应度数值:针对当前候选样本集合,以所述加权有穷自动机为问询向导,计算适应度函数值;判断目标阈值:检测样本集合对应的适应度值是否达到目标阈值;判断未达到目标阈值时,选择目标函数值最大的两条样本数据进行交叉合成新的样本数据,然后对新的样本数据进行变异,随机选取序列中单词替换为其近邻词,再次回到所述预测数据步骤,进入循环;判断达到目标阈值时,执行下一步;生成对抗样本:判断达到目标阈值时,则返回满足条件的对抗样本,当达到最大迭代次数,也就是整体算法循环次数上限,此时返回迭代终止时的最后对抗样本集合。

全文数据:

权利要求:

百度查询: 北京大学 一种生成黑盒循环神经网络对抗样本的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。