买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供一种敏感信息识别模型的训练方法、装置、设备及存储介质,方法包括:获取风险数据集合;训练步骤:采用风险数据集合对识别模型进行一轮次训练得到初步识别模型;校验当前轮次数是否超出预设的轮次数阈值;若未超出,结合当前风险数据集合与增量风险数据集合得到第二风险数据集合;以第二风险数据集合作为风险数据集合,以本训练轮次初步训练模型作为识别模型,返回训练步骤直至超出;若超出,以上一训练轮次初步识别模型为目标教师模型,以本训练轮次初步训练模型为目标学生模型;采用知识蒸馏方式结合目标教师模型与目标学生模型得到目标敏感信息识别模型。采用本发明能够训练得到具备高识别准确率的目标敏感信息识别模型。
主权项:1.一种敏感信息识别模型的训练方法,其特征在于,包括:预处理步骤:获取预设的风险数据集合,所述风险数据集合中的风险数据被标注有风险类型;训练步骤:采用所述风险数据集合对识别模型进行一轮次训练,得到初步识别模型;校验步骤:校验当前训练轮次的轮次数是否超出预设的轮次数阈值,得到校验结果;所述轮次数阈值≥2次;第一执行步骤:若所述校验结果为未超出,结合当前所述风险数据集合与增量风险数据集合得到第二风险数据集合,其中:所述增量风险数据集合中的各增量风险数据均标注有风险类型,且所述增量风险数据的风险类型与当前所述风险数据的风险类型不相同;以所述第二风险数据集合作为新的所述风险数据集合,以本训练轮次得到的初步训练模型作为新的所述识别模型,返回所述训练步骤直至所述校验结果为超出;第二执行步骤:若所述校验结果为超出,以上一训练轮次得到的所述初步识别模型作为目标教师模型,以本训练轮次得到的所述初步训练模型作为目标学生模型;采用知识蒸馏方式结合所述目标教师模型与所述目标学生模型,得到目标敏感信息识别模型;所述预设的轮次数阈值可以根据所述增量风险数据的数量确定;每一训练轮次均以第一损失函数作为所述识别模型的损失函数;所述第一损失函数由第一分类损失函数、第一定位损失函数及第一置信度损失函数构成;以第二损失函数作为知识蒸馏的损失函数;所述第二损失函数由第二分类损失函数、第二定位损失函数及第二置信度损失函数构成;其中,所述第二分类损失函数为KL散度分布函数;所述第二定位损失函数由所述目标教师模型的预测器的定位层张量与所述目标学生模型的预测器的定位层张量之间的均方误差MSE值确定;所述第二置信度损失函数由所述目标教师模型的预测器的置信度层张量与所述目标学生模型的预测器的置信度层张量之间的均方误差MSE值确定;所述识别模型为卷积神经网络CNN模型,且对所述识别模型进行的每一轮次训练均为元学习训练;所述元学习训练,包括:根据所述风险数据集合创建多个第一任务集合,各所述第一任务集合均包括:由预设的第一数量的所述风险数据构成的支持集、由预设的第二数量的所述风险数据构成的查询集;从所述第一任务集合中随机选取预设的第三数量的第一任务作为本训练轮次的目标任务集合;以所述目标任务集合的支持集作为目标支持集;将所述目标支持集输入所述识别模型,确定所述识别模型的第一损失值;按照将所述第一损失值反向传播的方式修正所述识别模型,得到第一识别模型;以所述目标任务集合的查询集作为目标查询集;将所述目标查询集输入所述第一识别模型,确定所述第一识别模型的第二损失值;将所述第二损失值反向传播,确定所述识别模型的累积梯度值;根据所述累积梯度值修正所述第一识别模型,得到所述初步识别模型。
全文数据:
权利要求:
百度查询: 云账户技术(天津)有限公司 敏感信息识别模型的训练方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。