买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:一网互通(北京)科技有限公司
申请日:2025-01-01
公开(公告)日:2025-01-28
公开(公告)号:CN119383098A
专利技术分类:.采集监测数据[2022.01]
专利摘要:本发明实施例中提供了一种模块化的社交媒体数据采集方法、装置及电子设备,属于数据处理技术领域,该方法包括:在数据采集系统中设置引擎层、采集层和数据层;通过用于数据采集调度的Engines模块接收外部系统输入的请求信息,并根据预设的安全协议验证所述请求信息的合法性;当所述请求信息满足合法性要求之后,利用所述Engines模块对所述请求信息进行解析,得到解析结果;通过APIs模块或抓取模块执行相应的数据采集任务,并将采集到的数据传递给Pipelines模块进行数据解析和格式化,得到标准数据;将所述标准数据传递给所述Engines模块,利用所述Engines模块将所述标准数据发送给外部系统。本发明提高了社交媒体数据采集的易用性和灵活性。
专利权项:1.一种模块化的社交媒体数据采集方法,其特征在于,包括:在数据采集系统中设置引擎层、采集层和数据层,所述引擎层包括引擎模块和业务分项,所述业务分项包括多个不同类型的数据集,所述采集层包括负责封装API调用的APIs模块和负责数据采集的抓取模块,所述数据层包括用于数据格式转换的Pipelines模块;通过用于数据采集调度的Engines模块接收外部系统输入的请求信息,并根据预设的安全协议验证所述请求信息的合法性;当所述请求信息满足合法性要求之后,利用所述Engines模块对所述请求信息进行解析,得到解析结果,如果所述解析结果是对象ID,所述Engines模块调用APIs模块进行API获取详情,如果所述解析结果是链接,所述Engines模块调用抓取模块进行链接采集;通过APIs模块或抓取模块执行相应的数据采集任务,并将采集到的数据传递给Pipelines模块进行数据解析和格式化,得到标准数据;将所述标准数据传递给所述Engines模块,利用所述Engines模块将所述标准数据发送给外部系统。
百度查询: 一网互通(北京)科技有限公司 模块化的社交媒体数据采集方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。