Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京火山引擎科技有限公司王恩策获国家专利权

北京火山引擎科技有限公司王恩策获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京火山引擎科技有限公司申请的专利一种文件合并方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116932497B

龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310919449.7,技术领域涉及:G06F16/174;该发明授权一种文件合并方法及装置是由王恩策;孙科;郭俊;罗旋设计研发完成,并于2023-07-25向国家知识产权局提交的专利申请。

一种文件合并方法及装置在说明书摘要公布了:本申请公开了一种文件合并方法,包括:获取多个待合并数据湖文件中存储的初始数据,初始数据为经过序列化、压缩和编码中其中一项或者多项处理的数据。将初始数据直接作为目标数据湖文件中的存储数据,并根据存储数据在目标数据湖文件中的存储位置,得到目标数据湖文件的目标元数据。将存储数据和目标元数据写入目标数据湖文件,从而得到由多个待合并数据湖文件合并得到的目标数据湖文件。利用本申请实施例的方案,在将多个待合并数据湖文件合并为目标数据湖文件时,无需首先对待合并数据湖文件中存储的数据进行处理,而是可以直接将原始数据作为目标数据湖文件中的存储数据,从而提升了将多个待合并数据湖文件合并为目标数据湖文件的效率。

本发明授权一种文件合并方法及装置在权利要求书中公布了:1.一种文件合并方法,其特征在于,所述方法包括:获取多个待合并数据湖文件中存储的初始数据,所述初始数据为经过序列化、压缩和编码中其中一项或者多项处理的数据,所述待合并数据湖文件为文件大小小于一个数据块大小的Parquet小文件;将所述初始数据直接作为目标数据湖文件中的存储数据;根据所述存储数据在所述目标数据湖文件中的存储位置,得到所述目标数据湖文件的目标元数据;将所述存储数据和所述目标元数据写入所述目标数据湖文件;所述将所述存储数据和所述目标元数据写入所述目标数据湖文件,包括:首先将所述初始数据直接写入目标数据湖文件,而后将所述目标元数据写入至所述目标数据湖文件;所述根据所述存储数据在所述目标数据湖文件中的存储位置,得到所述目标数据湖文件的目标元数据,包括:在将所述初始数据直接写入目标数据湖文件之后,根据所述存储数据在所述目标数据湖文件中的存储位置,得到所述目标数据湖文件的目标元数据;所述获取多个待合并数据湖文件中存储的初始数据,包括:遍历所述多个待合并数据湖文件,针对每个待合并数据湖文件,执行如下操作:根据所述待合并数据湖文件的元数据,确定所述待合并数据湖文件中的行组在所述待合并数据湖文件中的偏移量与大小;根据所述行组的元数据,确定所述待合并数据湖文件中的列块在所述待合并数据湖文件中的偏移量与大小;获取所述列块中的数据作为所述初始数据。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京火山引擎科技有限公司,其通讯地址为:100190 北京市海淀区紫金数码园4号楼13层1309;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。