江西警察学院;南昌大学涂敏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江西警察学院;南昌大学申请的专利一种结构化敏感数据的检测方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120805199B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511277839.4,技术领域涉及:G06F21/64;该发明授权一种结构化敏感数据的检测方法、系统、设备及介质是由涂敏;吴丹;邵国林;庞孟;刘绮玥;徐健锋;胡然;龚红辉;刘斓;金自康设计研发完成,并于2025-09-09向国家知识产权局提交的专利申请。
本一种结构化敏感数据的检测方法、系统、设备及介质在说明书摘要公布了:本申请属于数据安全技术领域,公开了一种结构化敏感数据的检测方法、系统、设备及介质,该方法包括:获取结构化数据并预处理为token序列;对token序列进行上下文特征提取,得到每个token的上下文特征向量;基于上下文特征向量计算每个token的注意力权重,形成初始注意力权重分布;对初始注意力权重分布进行异常感知,识别并量化异常注意力权重,生成最终注意力权重掩码;应用最终注意力权重掩码对初始注意力权重分布进行屏蔽和归一化,得到调整后的注意力权重;基于调整后的注意力权重和上下文特征向量计算得到样本的上下文表示向量;根据上下文表示向量对结构化数据进行敏感类别预测。该方法能解决因结构化数据中标签混杂、语义不稳定带来的干扰问题。
本发明授权一种结构化敏感数据的检测方法、系统、设备及介质在权利要求书中公布了:1.一种结构化敏感数据的检测方法,其特征在于,包括以下步骤: 获取结构化数据并预处理为token序列; 对所述token序列进行上下文特征提取,得到每个token的上下文特征向量; 基于所述上下文特征向量计算每个token的注意力权重,形成初始注意力权重分布; 对所述初始注意力权重分布进行异常感知,识别并量化异常注意力权重,生成最终注意力权重掩码; 对所述初始注意力权重分布进行异常感知,具体包括:在模型训练的批次内,针对每个token位置,统计该批次内所有样本在该位置的注意力权重的统计特征,所述统计特征包括第一四分位数和第三四分位数,并基于所述第一四分位数和第三四分位数计算四分位距;根据所述注意力权重、所述第一四分位数、所述第三四分位数和所述四分位距,计算每个样本在每个token位置的注意力权重的偏离度;对所述偏离度进行非线性变换,以得到对极端值不敏感且包含偏离方向信息的最终偏离度; 所述生成最终注意力权重掩码的步骤,包括生成第一层掩码和第二层掩码;所述第一层掩码为全局token级掩码,通过以下方式生成:计算所述最终偏离度在每个token位置上于批次内的方差;将所述方差与预设的方差阈值进行比较,当所述方差大于所述方差阈值时,将该token位置在所述第一层掩码中标记为待处理; 所述第二层掩码为样本级掩码,通过以下方式生成:针对所述第一层掩码标记为待处理的token位置,计算其最终偏离度在批次内的均值和标准差;基于所述均值和标准差设定动态的上下边界阈值,其中,上边界阈值为所述均值与一个第一系数乘以标准差之和,下边界阈值为所述均值与一个第二系数乘以标准差之差;对于每个样本,若其在待处理token位置上的最终偏离度大于所述上边界阈值或小于所述下边界阈值,则在所述第二层掩码的对应位置进行标记;所述最终注意力权重掩码由所述第一层掩码和所述第二层掩码进行逻辑与操作得到; 应用所述最终注意力权重掩码对所述初始注意力权重分布进行屏蔽和归一化,得到调整后的注意力权重; 基于所述调整后的注意力权重和所述上下文特征向量计算得到样本的上下文表示向量; 根据所述上下文表示向量对所述结构化数据进行敏感类别分类预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江西警察学院;南昌大学,其通讯地址为:330000 江西省南昌市新建区梅岭大道1666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励