首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种OLAP数据库排序算子中的高性能归并方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津南大通用数据技术股份有限公司

摘要:本发明提供了一种OLAP数据库排序算子中的高性能归并方法,包括:将排序算子的输入数据的单位定义为段,每段为输入段;将每个输入段中的数据块添加到排序算子的cache中,用以在排序和物化时使用,其中数据块为输入数据的最小输入单元;针对添加到排序算子的cache中的输入数据进行内部排序,形成排序后的输入数据;针对排序后的输入数据,按照分割点拆分成t个子任务;分别在每个子任务中进行归并,所有子任务的归并结果即为整体的归并结果;根据整体的归并结果物化排序列的实际数据以及其它查询需要的列,输出结果。本发明有益效果:一种OLAP数据库排序算子中的高性能归并方法,可充分发挥多核CPU的计算性能,大幅缩短归并耗时。

主权项:1.一种OLAP数据库排序算子中的高性能归并方法,设排序算子的并行度为t,即至多可以使用t个线程来工作,其特征在于,包括:将排序算子的输入数据的单位定义为段,分别将每路输入数据称为输入段,设定具有t个输入段;分别将t个输入段中包含的数据块添加到排序算子的缓存器中,其中数据块为输入数据的最小输入单元;针对添加到排序算子的缓存器中的数据块进行内部排序,形成排序后的输入数据;设定具有t-1个分割点,利用t-1个分割点将排序后的输入数据分割,形成t段数据段,每个数据段对应一个子任务;分别在t个子任务中进行归并,将t个子任务的归并结果整合,形成整体的归并结果;设待归并的输入段长度总和为N;对输入段的切分过程,最终目的为得到一组评估分割点,将每个输入段切分为t份,使得所有输入段的第i份长度之和接近Nt,其中0≤it;采用基于归并矩阵的二分查找确定精确的评估分割点:首先定义概念,将左路输入l视为纵轴,右路输入r视为横轴,矩阵中的每个元素为0或1,1表示在该位置上,l[y]=r[x],0表示l[y]r[x],若一个点x,y满足x-1,y-1,x,y-1两点中存在0,且x-1,y,x,y两点中存在1,则该点被称为归并交点;其过程分为以下几步:计算d=Nt,得到每个线程需要归并的数据行数,第i个线程开始归并的起点为di=d*i;使用二分查找,在左输入段查找下标d,使得x[di-d],y[d]是归并交点;此时得到的d和di-d即为l和r上的第i个评估分割点;同时处理多个输入段,适用于算子缓存中的数据过多,溢出到磁盘的情况,一轮归并输出最终结果,以减少磁盘IO次数。

全文数据:

权利要求:

百度查询: 天津南大通用数据技术股份有限公司 一种OLAP数据库排序算子中的高性能归并方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。