Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜延安大学刘翼获国家专利权

恭喜延安大学刘翼获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜延安大学申请的专利一种基于静态污染的个人标识信息定位识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114357250B

龙图腾网通过国家知识产权局官网在2025-04-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111440354.4,技术领域涉及:G06F16/901;该发明授权一种基于静态污染的个人标识信息定位识别方法是由刘翼设计研发完成,并于2021-11-30向国家知识产权局提交的专利申请。

一种基于静态污染的个人标识信息定位识别方法在说明书摘要公布了:本发明涉及一种基于静态污染的个人标识信息定位识别方法,属于网络信息安全技术领域。本方法以输入个人标识信息作为共享信息,并利用共享信息在数据中流动的行为,发现不同“服务‑位置”之间的关联关系,构建信息流图,并利用图论的遍历算法定位抽取个人标识信息。本方法根据输入的感染值,自动精准地定位抽取个人标识信息。本发明有效解决了在网络流量数据中,特别是大规模网络流量数据下,实现精准定位抽取个人标识信息的问题,同时克服了“过度污染”产生的误报,能够帮助自动标注大规模稀疏数据集,避免人工干预和众包反馈。

本发明授权一种基于静态污染的个人标识信息定位识别方法在权利要求书中公布了:1.一种基于静态污染的个人标识信息定位识别方法,其特征在于,包括如下步骤:步骤1:将网络流量转化为数据集,数据集包含三个维度:应用服务Domain、位置Key和个人标识信息Value;其中,Domain简称D,位置Key简称K,个人标识信息Value简称V;步骤1.1:从网络收集流量数据;步骤1.2:判断选取的数据包是否为HTTP请求字段,如果是,采用正则表达式提取其特征信息;用户访问应用服务Domain,并通过协议Protocol传输网络流量;如果在位置K传输的信息为个人标识信息V,则协议Protocol传输的网络流量表示为样本空间:Sp=D,K,V,其中,Sp表示利用协议P传输的网络流量;步骤2:对步骤1输出的数据集进行过滤与整形;步骤3:利用递归污染过程,建立信息流图,其中,污染过程包含域间传播过程和域内感染过程;当用户访问应用服务时,其中的一部分信息被识别为个人标识信息V,并由此产生两个用户行为关联关系:1当用户访问不同应用服务时,相同的个人标识信息将在不同的服务-位置Domain-Key内共享,简称DK,这些共享的信息被定义为共享值sharevalues;2相同服务-位置中传输相同类别的信息;将用户访问的服务-位置定义为域Area,其中,传输不同种类的信息都表示用户或对象的不同属性;设在用户访问的服务-位置数量为n,则与其相对应的域为:Area=DK1,DK2,…,DKn;集合中包含所有用户访问的DK,共有n个元素;同时,这些域中传输的信息表示为另一个集合:Value=V1,V2,…,Vm;其中,总共传输了m个信息;最后,按照DK与其中传输的信息Value,建立域内DK-V数据映射关系,其样本空间大小是每个域中包含的值的总和;利用域内DK-V数据映射关系,通过域内感染和域间传播两个过程,构建信息流图,其中,域内感染引入约束函数控制感染的范围,域间传播引入共享值控制传播的方向;步骤4:利用静态污染抽取算法,定位抽取个人标识信息;步骤4.1:在数据中选择一个个人标识信息,作为输入的感染信息;步骤4.2:按照输入的感染信息构建信息流图;信息流图的构建过程是通过执行域内感染和域间传播两个交替循环模式,最终实现数据搜索的收敛;构建信息流图的方法如下:步骤A:域内感染,是在DK中选择相似信息的过程;设用户i产生的域和信息分别为DKi和Vi,用户j产生的域和信息分别为DKj和Vj;若DKi=DKj且Vi≠Vj,即,用户i和用户j访问相同的DK且传输的信息V不同;如果确定Vi是个人标识信息,即Vi∈PII,则Vj也属于个人标识信息,即Vj∈PII,PII表示个人标识信息;若在一个域DK中存在一个Value是个人标识信息,则这个DK包含所有Value都是个人标识信息,即,DK及其包含的信息Value通过域内感染来选择,以形成集合IAIDK={DK∈PII|V∈PII,V∈DK};域内感染的作用是在每个域中提取相同类别的信息;步骤B:域间传播,域内感染是利用域内共享值建立的域间关系;当用户访问不同的服务时,DK中会传输相同的信息,这些信息被定义为共享值,依靠这些共享值使DK相互之间建立关联关系;在两个DK中存在多个共享值,这些DK之间的关系和共享值表示为邻接矩阵;若方法以n个DK作为顶点,顶点的集合N={dk1,dk2,…,dkn},则各顶点之间的关系作为一个边的集合E;利用上述顶点和边的关系建立一个信息流图IFG=N,E,其中,N表示信息流图的节点,E表示信息流图的边;步骤C:设置约束函数;利用控制域内感染信息内容的范围和域间传播方向来抽取个人标识信息;域内感染根据个人标识信息的类型格式的先验知识,能够找出个人标识信息的规则作为约束函数;步骤4.3:静态污染算法输出两个列表,包括个人标识信息列表ValueList和个人标识信息服务位置列表DKList;选取V1为感染信息,并作为静态污染抽取算法的输入;首先,执行算法的第一轮次:在初始情况下,信息列表ValueList只包含一个V1,而服务-位置列表DKList为空;信息列表ValueList中的V1被作为共享值,执行域间传播首先搜索到两个域DK1与DK2;执行算法的第2轮次:执行域内传染,从DK1域中搜索到V2;以V2作为共享值执行域间传播,得到域DK6;执行算法的第3轮次:执行域内感染,从DK2域中搜索到V3、V4;以V3作为共享值执行域间传播,得到域DK3;然后,执行算法的第3轮次:执行域内感染,从域DK2中搜索到V3、V4;然后以V4作为共享值执行域间传播,得到域DK9;以此,将信息列表ValueList中的每一个元素顺序作为共享值,循环模式反复执行域内感染与域间传播;每一次交替执行域内感染与域间传播的过程被定义为算法执行的轮次;最终经过多轮Round收敛,输出信息列表ValueList和服务位置列表DKlist,列表内元素的顺序为按照搜索的顺序列出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人延安大学,其通讯地址为:716000 陕西省延安市宝塔区圣地路580号延安大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。