首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种多设备网页中内嵌广告获取以及恶意性识别的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨工业大学(威海)

摘要:本发明涉及一种多设备网页中内嵌广告获取以及恶意性识别的方法,其解决了现有技术对跨平台及跨浏览器广告识别及恶意性标注方法较少,且不够完善,不够系统的技术问题,其步骤包括:从浏览器HTML文本中对资源记录进行捕捉,根据广告判定规则,使用正则表达式方式筛选出广告资源,并分别对广告资源中的图片资源和跳转链接资源进行解析;对解析结果按不同维度进行分类,具体包括:煽动特征分类过程和广告内容分类过程;对各维度分类结果,按维度重要程度进行加权赋值,标注广告的恶意性程度,进行风险评估。本发明可广泛应用于对违法违规广告的监测识别。

主权项:1.一种多设备网页中内嵌广告获取以及恶意性识别的方法,其特征是,其步骤包括:步骤一:从浏览器HTML文本中对资源记录进行捕捉,根据广告判定规则,使用正则表达式方式筛选出广告资源,并分别对广告资源中的图片资源和跳转链接资源进行解析;步骤二:对解析结果按不同维度进行分类,具体包括:煽动特征分类过程和广告内容分类过程;所述步骤二中煽动特征分类过程具体步骤包括:步骤61,初始化煽动性指数阈值TDlow,TDhigh;步骤62,导入特征列表Lfeature;步骤63,导入特征列表Lfeature中任意属性ai在煽动性词汇表的出现频率Fa,并计算广告特征列表L的煽动性指数Lscore,计算公式为步骤64,根据煽动性指数阈值对煽动性指数Lscore离散化处理,当LscoreTDlow时,认定广告特征列表L为无煽动性广告,当LscoreTDhigh时,认定L为强煽动性广告;否则,认定L为一般煽动性广告;所述步骤二中广告内容分类过程具体步骤包括:步骤71,导入特征列表Lfeature;步骤72,导入特征列表Lfeature中任意属性ai在各类别yk中出现的条件概率Pai|yk,根据朴素贝叶斯后验概率公式,计算得到广告特征列表L对应各类别yk归属概率列表Pyk|L,转至步骤73;步骤73,取广告特征列表L对应各类别归属概率最大值对应的类别yk作为广告特征列表L的内容分类结果,即Pyk|x=maxPy1|x,Py2|x,…,Pyn|x,x∈yk;步骤三:对步骤二各维度分类结果,按维度重要程度进行加权赋值,标注广告的恶意性程度,进行风险评估。

全文数据:

权利要求:

百度查询: 哈尔滨工业大学(威海) 一种多设备网页中内嵌广告获取以及恶意性识别的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术