买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:天翼云科技有限公司
摘要:本发明公开了一种基于flink按事件时间升序增量查询hudi表的方法,包括:S1获取数据文件、S2读取数据文件和S3处理实时数据流;所述数据获取通过的扫描数据获取数据文件,获取的数据文件随后对其进行读取,读取完成后对数据文件进行接收并处理。本发明通过通过插入[标识行]表示一次增量查询结束,无须等待下一次增量查询数据到达,及时触发缓存数据排序输出,避免数据处理不及时,如果hudi表的以[事件时间]分区的分区表,则按分区升序串行读取数据文件,将以分区为粒度缓存数据进行排序,在存量数据大的情况下,可以大大减少资源消耗,并且以分区为触发条件可将一次增量查询的数据分批次进行排序输出。
主权项:1.一种基于flink按事件时间升序增量查询hudi表的方法,其特征在于:包括:S1获取数据文件、S2读取数据文件和S3处理实时数据流;所述数据获取通过的扫描数据获取数据文件,获取的数据文件随后对其进行读取,读取完成后对数据文件进行接收并处理。
全文数据:
权利要求:
百度查询: 天翼云科技有限公司 一种基于flink按事件时间升序增量查询hudi表的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。