首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于混合自回归模型与采样的查询基数估计方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:复旦大学;星环信息科技(上海)股份有限公司

摘要:本发明属于数据库查询技术领域,具体为一种基于混合自回归模型与采样的查询基数估计方法。本发明包括构建一种多路并行掩码自编码模型,该模型可以更好地学习数据中的联合概率分布;一种离线连接键采样的基数估计方法,该方法通过依照连接键在多表连接中进行单表采样,以完成基数估计;一种将自回归模型与连接键采样混合的基数估计方法,可以结合两者的基数估计优势,提高基数估计方法的整体准确性。本发明可以减少传统自回归模型进行基数估计时的查询高分位误差,提高基数估计的稳定性,提高查询优化器生成的查询计划质量,加速数据库的查询执行。

主权项:1.一种基于混合自回归模型与采样的查询基数估计方法,其特征在于,具体步骤为:一多路并行掩码自编码模型设计与训练:所述的多路并行掩码自编码模型,以下简称模型,具体是利用多个掩码自编码层并行构筑的多层神经网络模型,使用原始数据集进行训练,获取原始数据库数据表中不同列间的联合概率分布;所述多路并行掩码自编码模型,包括Embedding编码层、运算模块;运算模块包括数据特征提取层,数据特征增强层与最终运算层;模型最后输出为不同列间的条件概率分布;所述特征提取层包括多个掩码自编码层和一个平均池化层;其中,所述掩码自编码层源自掩码自回归模型的单层结构,通过在层间设置掩码使得全连接层获取自回归性;所述特征增强层,其结构与特征提取层相同,也包括多个掩码自编码层和一个平均池化层,所述掩码自编码层源自掩码自回归模型的单层结构,通过在层间设置掩码使得全连接层可以获取自回归性;所述最终计算层,包括一个完整且较大的掩码自编码层W;二离线连接键采样:所述的离线连接键采样,以下简称采样,具体步骤包含确定采样构建模式图顺序、采样比例确认与基于连接进行采样;三混合自回归模型与离线连接键采样的基数估计:所述的混合自回归模型与离线连接键采样的基数估计,具体包括:查询的基数估计,离线连接键采样上的基数估计,混合基数估计,得到最终查询基数估计值。

全文数据:

权利要求:

百度查询: 复旦大学 星环信息科技(上海)股份有限公司 基于混合自回归模型与采样的查询基数估计方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。