华南理工大学谢凯歌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利一种算子级别的分布式数据库性能测试方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118193388B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410355412.0,技术领域涉及:G06F11/3668;该发明授权一种算子级别的分布式数据库性能测试方法是由谢凯歌;全宇晖;许勇设计研发完成,并于2024-03-27向国家知识产权局提交的专利申请。
本一种算子级别的分布式数据库性能测试方法在说明书摘要公布了:本发明公开了一种算子级别的分布式数据库性能测试方法,包括:根据数据集的类型和指定的规模生成所需的数据集,得到性能测试所需的数据集;对要测试的算子构建算子级别的查询计划,得到初始的查询计划;对得到的数据集进行数据分片,将基于行的存储格式存放的初始数据表改造成基于列存储的数据表方便后续处理,将列存储的数据组织成向量的形式,形成向量化的数据;将初始查询计划改造成分布式的执行计划,读取向量化的数据进行查询,收集性能测试指标。本发明能够详细捕获数据库在不同配置参数下的性能差异,为数据库性能调优提供了重要的参考依据。
本发明授权一种算子级别的分布式数据库性能测试方法在权利要求书中公布了:1.一种算子级别的分布式数据库性能测试方法,其特征在于,包括以下步骤: S1:根据数据集的类型和指定的规模生成所需的数据集,得到性能测试所需的数据集;对要测试的算子构建算子级别的查询计划,得到初始的查询计划;包括以下步骤: S111:指定数据表的Schema,从而指定数据集的类型;其中,Schema作为数据库设计的蓝图,是数据表的元数据,详细定义了数据表的框架,包括列的名称、数据类型和相关的约束条件,包括主键、外键、索引及数据完整性规则;支持三种数据集,分别为自定义数据集、随机数据集和TPC-H数据集,能够支撑功能性测试和性能测试; S112:判断并进行数据填充,如果所需要的数据集已经存在,则无需生成数据,直接使用已有的数据集;如果所需的数据集不存在,则调用内嵌的数据生成器根据不同的配置参数生成数据,支持多维度的输入参数,包括数据集的规模大小、数据集的类型和数据的分布特性; S121:将复杂的查询操作拆分成更小的、易于管理的单元,所述单元被设计成能够独立执行的子查询计划; S122:考虑数据依赖性、执行效率和资源利用率特性,将子查询计划按照逻辑顺序和数据流动路径组装起来,形成完整的查询计划,以确保查询计划正确无误; 其中,每一个算子的输出结果都被称作表达式Expr,这种表达式详细描述了算子对数据的逻辑处理,指定哪一列的数据进行了什么样的操作; S2:对得到的数据集进行数据分片,将基于行的存储格式存放的初始数据表改造成基于列存储的数据表方便后续处理,将列存储的数据组织成向量的形式,形成向量化的数据,包括以下步骤: S21:将初始数据按照数据的访问模式和分布特性进行切分,即分片,生成若干个小的、能够独立存储和查询的数据片段; S22:将以行为单位存储的数据表转换为以列为单位存储的数据表; S23:将列存的数据表组织成向量化的形式; S3:将初始查询计划改造成分布式的执行计划,读取向量化的数据进行查询,收集性能测试指标,包括以下步骤: S31:对查询进行分布式调度; 将一个复杂的查询拆分成多个简单的、能够并行执行的子任务,将子任务分配到集群的不同节点上执行,利用多个节点的计算能力和存储能力,节点之间通过网络传输中间结果; S32:在单台服务器上进行查询优化; S33:收集查询过程中算子的响应时间、处理时间、资源消耗、并发度和耗时占比指标,形成测试报告。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励