买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东华智人才科技有限公司
摘要:本发明涉及爬虫技术领域,提供了一种基于画布绘制文本的反爬虫方法、系统、存储介质及设备。基于画布绘制文本的反爬虫方法包括,获取待保密的数据,将待保密的数据按照设定规则进行分割,得到数据片段集合和数据片段的位置排列信息;遍历数据片段集合,按照设定规则从数据片段集合中抽取部分数据片段,为抽取的部分数据片段创建画布,得到第一画布集合;基于数据片段的位置排列信息,将画布集合中每个画布对应位置上的数据片段绘制到对应的画布中,得到第二画布集合;将未抽取的数据片段和第二画布集合进行按照数据片段的位置排列信息,在页面中进行排列。本发明基于画布绘制文本,代码难度较低,减少开发成本,增加反爬难度。
主权项:1.一种基于画布绘制文本的反爬虫方法,其特征在于,包括:获取待保密的数据,将待保密的数据按照设定规则进行分割,得到数据片段集合和数据片段的位置排列信息;遍历数据片段集合,按照设定规则从数据片段集合中抽取部分数据片段,为抽取的部分数据片段创建画布,得到第一画布集合;基于数据片段的位置排列信息,将画布集合中每个画布对应位置上的数据片段绘制到对应的画布中,得到第二画布集合;将未抽取的数据片段和第二画布集合进行按照数据片段的位置排列信息,在页面中进行排列;将待保密的数据按照设定规则进行分割,方法包括:若待保密的数据长度小于设定的阈值,则将待保密的数据按照一个字符对应一个数据片段进行分割;若待保密的数据长度大于等于设定的阈值,则将待保密的数据按照至少两个字符对应一个数据片段进行分割。
全文数据:
权利要求:
百度查询: 山东华智人才科技有限公司 基于画布绘制文本的反爬虫方法、系统、存储介质及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。