买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海中通吉网络技术有限公司
摘要:本发明涉及一种基于SQL的数据处理方法、装置和设备,方法包括获取用户编写的抽数SQL,以及,从元数据库中调取预先创建的Hive表和HBase虚表;HBase虚表用于映射HBase实体表;在Calcite中,结合抽数SQL、HBase虚表、Hive表,生成物理执行计划,并将物理执行计划发送到HadoopYarn;利用Yarn调度物理执行计划,读取HBase实体表中的数据写入Hive表中。抽取数据不经过HBaseRegionServer,避免对HBase服务造成压力,用户只需要在调度平台编写一个简单的抽数SQL,节约了人力成本,有效提高了HBase数据库中的数据导入到Hive数据库的效率。
主权项:1.一种基于SQL的数据处理方法,其特征在于,包括:获取用户基于实际需求编写的抽数SQL,以及,从元数据库中调取预先创建的Hive表和HBase虚表;其中,所述HBase虚表用于映射HBase实体表;在Calcite中,结合所述抽数SQL、所述HBase虚表、所述Hive表,生成物理执行计划,并将所述物理执行计划发送到HadoopYarn,包括;在所述Calcite中,结合所述抽数SQL、所述HBase虚表、所述Hive表,生成逻辑执行计划;基于所述Calcite中的固定规则和所述Calcite中预先注册的自定义规则,对所述逻辑执行计划进行优化;调用所述Calcite中预先注册的物理转换器,将优化后的逻辑执行计划转换为所述物理执行计划;所述物理转换器包括MapReduce物理转化器,所述物理执行计划包括MapReduce执行树;利用所述HadoopYarn调度所述物理执行计划,读取所述HBase实体表中的数据写入所述Hive表中,包括:利用所述HadoopYarn调度所述物理执行计划,获取所述HBase实体表的快照;基于所述快照,利用所述HadoopYarn调度所述MapReduce执行树的Mapper读取所述HBase实体表中的数据;利用所述HadoopYarn调度所述MapReduce执行树中的Reducer对数据进行处理,并写入所述Hive表中。
全文数据:
权利要求:
百度查询: 上海中通吉网络技术有限公司 基于SQL的数据处理方法、装置和设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。