买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司
摘要:本申请提供一种网页篡改检测模型的训练、应用方法及装置,该网页篡改检测模型的训练方法包括:获取多个网页中的description字段内容和text字段内容,并进行数据清洗处理,得到description纯净内容和text纯净内容;根据预设的Bert模型对description纯净内容和text纯净内容进行编码,得到编码字段;获取与编码字段相匹配的语义矛盾检测结果;根据语义矛盾检测结果、description纯净内容、text纯净内容和预设训练条件进行训练,得到网页篡改检测模型。可见,实施这种实施方式,能够基于网页中上下文语义矛盾性训练出一种高精度地网页篡改检测模型,从而使得该网页篡改检测模型能够批量对网页进行篡改检测,从而能够使得用户认出篡改网页并对其进行安全防范。
主权项:1.一种网页篡改检测模型的训练方法,其特征在于,所述方法包括:获取多个网页中的description字段内容和text字段内容;对所述description字段内容和所述text字段内容进行数据清洗处理,得到description纯净内容和text纯净内容;根据预设的Bert模型对所述description纯净内容和所述text纯净内容进行编码,得到编码字段;获取与所述编码字段相匹配的语义矛盾检测结果;所述语义矛盾检测结果用于表示所述description纯净内容和所述text纯净内容之间是否存在语义矛盾;根据所述语义矛盾检测结果、所述description纯净内容和所述text纯净内容,生成数据训练集;将所述数据训练集输入至预设的原始检测模型中,以使所述原始检测模型根据预设训练条件进行训练,得到网页篡改检测模型。
全文数据:
权利要求:
百度查询: 北京天融信网络安全技术有限公司 北京天融信科技有限公司 北京天融信软件有限公司 一种网页篡改检测模型的训练、应用方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。