Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军海军工程大学段立获国家专利权

中国人民解放军海军工程大学段立获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军海军工程大学申请的专利一种数据爬取方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119760206B

龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411890798.1,技术领域涉及:G06F16/951;该发明授权一种数据爬取方法、系统、设备及存储介质是由段立;罗兵;张显峰;黄亮;梁镇彬;孙乔;刘树衎;郭云玮设计研发完成,并于2024-12-20向国家知识产权局提交的专利申请。

一种数据爬取方法、系统、设备及存储介质在说明书摘要公布了:本发明提供一种数据爬取方法、系统、设备及存储介质,方法包括:获取目标网站的站点信息,根据所述站点信息配置对应的爬虫脚本;根据所述爬虫脚本生成对应的爬取任务;执行所述爬取任务,获取所述目标网站中的目标数据;将所述目标数据进行保存,并生成目标数据索引;根据所述目标数据索引,利用数据导出接口将所述目标数据进行导出。本发明只要通过站点信息即可创建对应爬虫脚本,然后通过爬虫脚本执行爬取任务,可获取用户想要的数据,大大减少了数据获取的成本。

本发明授权一种数据爬取方法、系统、设备及存储介质在权利要求书中公布了:1.一种数据爬取方法,其特征在于,包括: 获取目标网站的站点信息,根据所述站点信息配置对应的爬虫脚本; 根据所述爬虫脚本生成对应的爬取任务; 执行所述爬取任务,获取所述目标网站中的目标数据; 将所述目标数据进行保存,并生成目标数据索引; 根据所述目标数据索引,利用数据导出接口将所述目标数据进行导出; 所述获取所述目标网站中的目标数据,包括: 判断所述目标网站是否为外网服务器; 若为所述外网服务器,则根据外网站点选择对应的摆渡规则制定摆渡任务; 在到达所述摆渡任务的执行时间点时,根据外网站点查询上次的摆渡时间,根据上次的摆渡时间筛选出增量数据,调用所述摆渡任务,将所述外网服务器的所述增量数据转换为数据压缩包; 将所述增量数据压缩包传输到内网服务器,对所述数据压缩包进行还原,得到所述目标数据; 所述获取所述目标网站中的目标数据之后,包括: 利用所述目标数据对所述目标网站的已爬取页面进行数据替换,得到已提取页面,并生成与所述已爬取页面对应的已提取标识; 第一次进入目标网站的详情页后,先根据数据库中记录的数据替换状态判断详情页是否已经处理过,如果没有则会取出原html,并根据和爬虫工程师约定好的标识来替换资源文件; 第二次进入所述详情页时根据所述资源文件的替换状态判断是否已经处理过详情页。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军海军工程大学,其通讯地址为:430000 湖北省武汉市硚口区汉水桥街道解放大道717号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。