首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于请求时序特征的爬虫侦测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广州易起行信息技术有限公司

摘要:本发明公开了一种基于请求时序特征的爬虫侦测方法,涉及爬虫侦测技术领域,旨在解决判断其是否为爬虫的问题,其技术方案要点是:包括如下步骤:步骤一:数据收集:收集用户请求数据。本发明通过构建特定的时间序列用户请求特征数据集,从而能够更全面地捕捉到爬虫行为的时序特点,从而提高了爬虫侦测的准确性,且对系统无入侵性逻辑,利用最大似然估计法来预测当前用户是爬虫的概率,对新的用户请求进行概率预测,更加精确地判断当前用户是正常用户还是爬虫,并及时采取相应的防御措施,保护网站的安全和正常运行,具有高准确性、鲁棒性和实时性的优势,适用于各种场景下的爬虫侦测需求。

主权项:1.一种基于请求时序特征的爬虫侦测方法,其特征在于,包括如下步骤:步骤一:数据收集:收集用户请求数据,请求数据包括用户的请求时间戳、用户标识、请求路径、请求头信息、IP地址、浏览器指纹数据,请求数据将通过网站服务器日志或者专门的请求记录模块进行收集;步骤二:识别实现:利用二分类的预测方法将请求记录模块中收集到数据进行相应的计算,通过多次的迭代,最终逼近出参数θ,在预测时,通过代入最新时刻的监控指标,可得到最终期望的预测值;在步骤一中,请求时间戳是记录用户请求时间的关键信息,用于计算请求的时间间隔、请求的频率等时序特征,用户标识是用于区分不同用户的唯一标识,请求路径表示用户访问的具体资源或页面。

全文数据:

权利要求:

百度查询: 广州易起行信息技术有限公司 一种基于请求时序特征的爬虫侦测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。