恭喜国网智能电网研究院有限公司;国家电网有限公司;国网辽宁省电力有限公司;国网辽宁省电力有限公司信息通信分公司张涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜国网智能电网研究院有限公司;国家电网有限公司;国网辽宁省电力有限公司;国网辽宁省电力有限公司信息通信分公司申请的专利一种基于标签分布学习的敏感数据智能识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113962302B 。
龙图腾网通过国家知识产权局官网在2025-05-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111223201.4,技术领域涉及:G06F18/22;该发明授权一种基于标签分布学习的敏感数据智能识别方法是由张涛;石聪聪;于鹏飞设计研发完成,并于2021-10-20向国家知识产权局提交的专利申请。
本一种基于标签分布学习的敏感数据智能识别方法在说明书摘要公布了:本发明公开了一种基于标签分布学习的敏感数据智能识别方法,该方法包括:获取多个已知结果的训练样本;根据标签分布学习算法以及所述训练样本生成训练样本的标签分布集合;根据所述标签分布集合确定预设神经网络的参数,得到神经网络模型;根据多个已知结果的训练样本对所述神经网络模型进行迭代训练,得到敏感数据识别模型。本发明实施例提供的训练基于标签分布学习的敏感数据识别模型的方法,通过标签分布算法以及预设参数,建立神经网络模型,能够使用多个标签对被检测数据概率化描述。通过利用训练样本对神经网络模型进行训练,能够将被检测数据文档与多个敏感数据相关的标签相对应,将文档数据转化为了数学模型,便于机器识别。
本发明授权一种基于标签分布学习的敏感数据智能识别方法在权利要求书中公布了:1.一种训练基于标签分布学习的敏感数据识别模型的方法,其特征在于,包括:获取多个已知结果的训练样本;已知结果的训练样本为已经标注数据敏感性之后的文档数据,即训练样本的敏感性结果是已知的;根据标签分布学习算法以及所述训练样本生成训练样本的标签分布集合;利用标签分布学习算法,计算预设标签与训练样本之间相关度,通过每一个预设标签与训练样本之间相关度的概率化分布集合来描述训练样本,该概率化分布集合即所述标签分布集合;根据所述标签分布集合确定预设神经网络的参数,得到神经网络模型;根据多个已知结果的训练样本对所述神经网络模型进行迭代训练,得到敏感数据识别模型;根据所述标签分布集合确定预设神经网络的参数,得到神经网络模型,包括:根据所述标签分布集合确定预设神经网络的提取特征参数;根据交叉熵损失确定预设神经网络的损失函数;所述损失函数通过如下公式表示: 其中,Loss表示损失函数,表示第i个样本数据对第m个标签的分布值,表示第i个样本数据属于第m个标签的预测概率,N表示样本数量,q代表标签数量;根据所述提取特征参数、所述损失函数、近似度参数以及预设近似度阈值确定神经网络模型;根据标签分布学习算法以及所述训练样本生成训练样本的标签分布集合,包括:获取文档词汇集合;计算词汇与标签之间的相关度;计算词汇与样本之间的相关度;生成训练样本的标签分布集合;所述生成训练样本的标签分布集合包括:计算样本标签相关度参数;所述样本标签相关度参数为所述词汇标签相关度与所述词汇样本相关度的乘积;所述样本标签相关度参数通过如下公式表示: 其中,ILRi,m是第i个样本与第m个标签的相关度;计算标签分布集合;所述标签分布集合为单个词汇样本标签相关度参数占所有词汇样本标签相关度参数;所述训练样本的标签分布集合通过如下公式表示: 其中,Di为第i个样本的标签分布集合,q为标签的数量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网智能电网研究院有限公司;国家电网有限公司;国网辽宁省电力有限公司;国网辽宁省电力有限公司信息通信分公司,其通讯地址为:102209 北京市昌平区未来科技城滨河大道18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。