敏感信息识别模型的训练方法、装置、设备及存储介质

导航：龙图腾网> 最新专利技术> 敏感信息识别模型的训练方法、装置、设备及存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明提供一种敏感信息识别模型的训练方法、装置、设备及存储介质，方法包括：获取风险数据集合；训练步骤：采用风险数据集合对识别模型进行一轮次训练得到初步识别模型；校验当前轮次数是否超出预设的轮次数阈值；若未超出，结合当前风险数据集合与增量风险数据集合得到第二风险数据集合；以第二风险数据集合作为风险数据集合，以本训练轮次初步训练模型作为识别模型，返回训练步骤直至超出；若超出，以上一训练轮次初步识别模型为目标教师模型，以本训练轮次初步训练模型为目标学生模型；采用知识蒸馏方式结合目标教师模型与目标学生模型得到目标敏感信息识别模型。采用本发明能够训练得到具备高识别准确率的目标敏感信息识别模型。

主权项：1.一种敏感信息识别模型的训练方法，其特征在于，包括：预处理步骤：获取预设的风险数据集合，所述风险数据集合中的风险数据被标注有风险类型；训练步骤：采用所述风险数据集合对识别模型进行一轮次训练，得到初步识别模型；校验步骤：校验当前训练轮次的轮次数是否超出预设的轮次数阈值，得到校验结果；所述轮次数阈值≥2次；第一执行步骤：若所述校验结果为未超出，结合当前所述风险数据集合与增量风险数据集合得到第二风险数据集合，其中：所述增量风险数据集合中的各增量风险数据均标注有风险类型，且所述增量风险数据的风险类型与当前所述风险数据的风险类型不相同；以所述第二风险数据集合作为新的所述风险数据集合，以本训练轮次得到的初步训练模型作为新的所述识别模型，返回所述训练步骤直至所述校验结果为超出；第二执行步骤：若所述校验结果为超出，以上一训练轮次得到的所述初步识别模型作为目标教师模型，以本训练轮次得到的所述初步训练模型作为目标学生模型；采用知识蒸馏方式结合所述目标教师模型与所述目标学生模型，得到目标敏感信息识别模型；所述预设的轮次数阈值可以根据所述增量风险数据的数量确定；每一训练轮次均以第一损失函数作为所述识别模型的损失函数；所述第一损失函数由第一分类损失函数、第一定位损失函数及第一置信度损失函数构成；以第二损失函数作为知识蒸馏的损失函数；所述第二损失函数由第二分类损失函数、第二定位损失函数及第二置信度损失函数构成；其中，所述第二分类损失函数为KL散度分布函数；所述第二定位损失函数由所述目标教师模型的预测器的定位层张量与所述目标学生模型的预测器的定位层张量之间的均方误差MSE值确定；所述第二置信度损失函数由所述目标教师模型的预测器的置信度层张量与所述目标学生模型的预测器的置信度层张量之间的均方误差MSE值确定；所述识别模型为卷积神经网络CNN模型，且对所述识别模型进行的每一轮次训练均为元学习训练；所述元学习训练，包括：根据所述风险数据集合创建多个第一任务集合，各所述第一任务集合均包括：由预设的第一数量的所述风险数据构成的支持集、由预设的第二数量的所述风险数据构成的查询集；从所述第一任务集合中随机选取预设的第三数量的第一任务作为本训练轮次的目标任务集合；以所述目标任务集合的支持集作为目标支持集；将所述目标支持集输入所述识别模型，确定所述识别模型的第一损失值；按照将所述第一损失值反向传播的方式修正所述识别模型，得到第一识别模型；以所述目标任务集合的查询集作为目标查询集；将所述目标查询集输入所述第一识别模型，确定所述第一识别模型的第二损失值；将所述第二损失值反向传播，确定所述识别模型的累积梯度值；根据所述累积梯度值修正所述第一识别模型，得到所述初步识别模型。

全文数据：

权利要求：

百度查询：云账户技术(天津)有限公司敏感信息识别模型的训练方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种铂-二氧化铈催化剂、其制备方法及其应用

下一篇：一种流表统计信息上报方法、装置、设备及存储介质

相关技术

一种铂-二氧化铈催化剂、其制备方法及其应用

一种流表统计信息上报方法、装置、设备及存储介质

应用程序的远程日志处理方法、装置、设备和存储介质

一种低成本防火性能复合材料制备方法

一种平面距离测量机构

用于实现激光束二维扫描的运动装置和方法

显示面板及显示终端

一种水利工程水渠格栅控制系统及控制方法

一种双供电温室内自走式施肥机器人

数字化项目评审数据服务平台建立方法

一种能够供氧的移动式隧道保障舱

一种小曲线大横坡节段箱梁施工方法

方法相关技术

图像重建方法、训练方法、检测方法、装置和存储介质_浙江大华技术股份有限公司_202111165805.8

挡片及其制备方法、刻蚀终点的确认方法和循环使用方法_粤芯半导体技术股份有限公司_202411167504.2

文本识别方法、拼写纠错方法及语音识别方法_阿里巴巴集团控股有限公司_201910632996.0

描绘数据检查方法、描绘方法、描绘装置以及程序_纽富来科技股份有限公司_202410669422.1

位置确定方法、闸机控制方法及装置_北京城建智控科技股份有限公司_202411519593.2

像素电路及其驱动方法、阵列基板及其测试方法_合肥维信诺科技有限公司_202411358337.X

电极、制造电极的方法及分离装置和方法_广东栗子科技有限公司_202010183572.3

动画处理方法和动画校验方法_腾讯科技(深圳)有限公司_201910503023.7

外延生长方法、尺寸补偿方法及形成掩膜图案的方法_北京北方华创微电子装备有限公司_202310622848.7

灯具及其控制方法_广州彩熠灯光股份有限公司_202411324015.3

训练相关技术

突防组合训练器_北京富丰睿科技有限公司_202420670810.7

识字训练素材生成装置、方法、识字训练方法及系统_北京师范大学_202411342485.2

一种利用下肢训练机器人进行坐站训练的方法_上海大学_202411137768.3

训练样本确定方法、网络模型训练方法、设备及存储介质_浙江大华技术股份有限公司_202411166378.9

在机器学习模型训练期间在模型大小和训练数据之间分配计算资源_渊慧科技有限公司_202380037218.1

可配重哑铃的训练器_浙江中盈健身器材有限公司_202420574086.8

一种力量训练装置_杨小寒_202323524433.0

一种手部训练结构_桂林市妇女儿童医院_202323383077.5

一种拳击训练反应球_浙江鑫哥工贸有限公司_202421042036.1

双模式控制的多训练方式腕关节康复训练装置及控制方法_吉林省金博弘智能科技有限责任公司_202411117193.9

模型相关技术

一种文生图模型的训练方法、模型、装置及电子设备_北京百度网讯科技有限公司_202310845680.6

一种协同大模型和推荐小模型计算的方法及系统_上海浙江大学高等研究院_202411120312.6

铁氧体材料磁化曲线模型的建立方法、模型及系统_山东得普达电机股份有限公司_202410348099.8

基于XGBOOST构建道面抗滑性能预测模型的方法及其构建的模型_烟台大学_202411133775.6

火车头模型烟雾生成方法、火车头及火车模型_东莞比高模型制品有限公司_202411070002.8

浅水湖泊模型网格剖分优化方法及水动力模型建立方法_河北省水利科学研究院(河北省大坝安全技术中心、河北省堤防水闸技术中心)_202410573564.8

电子设备及模型加载方法_联想(北京)有限公司_202411217956.7

一种BIM钢筋模型_浙江正匠建设工程有限公司_202420349951.9

一种弹片探针模型_浙江杭可科技股份有限公司_202323389210.8

优化飞机性能的参数模型_塔莱斯公司_201911315109.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

敏感信息识别模型的训练方法、装置、设备及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务