一种基于注意力机制和数据感知的基数估计优化方法

导航：龙图腾网> 最新专利技术> 一种基于注意力机制和数据感知的基数估计优化方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：电子科技大学

摘要：本发明属于数据库管理系统查询优化技术领域，具体涉及一种基于注意力机制和数据感知的基数估计优化方法。本发明提出了一种数据感知的双注意力模型，集成了位置注意力模块和交叉注意力模块，然后采用了基于贝叶斯神经网络的学习能力策略，通过蒙特卡洛dropout方法对模型不确定性进行量化，有效提升了模型对多样化数据分布的适应性和泛化能力，最后设计了主动学习数据采样策略，能够智能筛选出对模型训练最为关键的数据样本，优化学习过程，提高预测的准确性，通过集成学习策略，融合了通过不同数据采样策略获得的多个模型，构建了一个强大的集成模型，进一步提升了模型在多种查询工作负载下的泛化能力和稳定性。

主权项：1.一种基于注意力机制和数据感知的基数估计优化方法，其特征在于，包括以下步骤：S1、将数据库数据和查询语句进行特征化构建训练数据，具体为：将数据库状态进行特征化，对于数据库关系R的每个属性A，通过将A的值域划分为多个桶，并计算每个桶中A的值的频率来构建直方图，然后将直方图归一化并组合成数据库状态的特征向量集X；查询特征化包括连接特征化和过滤特征化，连接特征化将查询中的连接条件转化为二进制向量，表示连接的两个属性之间的关系；过滤特征化则将查询中的过滤条件转化为表示搜索超矩形边界点的向量，最后将这些特征向量组合成SQL查询的特征向量q；S2、基于双注意力模型构建基数估计模型，所述双注意力模型是指包括位置注意力模块和交叉注意力模块的双注意力模型，其中数据库状态的特征向量输入到位置注意力模块中进行处理，位置注意力模块通过自注意力机制捕捉数据库状态中属性之间的相关性；SQL查询的特征向量和位置注意力模块的输出同时输入到交叉注意力模块中，交叉注意力模块通过交叉注意力发现数据库数据与查询之间的相关性，得到基数估计；利用训练数据对构建的基数估计模型进行离线训练得到初步基数估计模型；S3、利用贝叶斯神经网络对初步基数估计模型输出的不确定性进行量化，通过主动学习策略进行数据采样，包括不确定性采样、上置信界与不确定性结合采样和二者结合的多样性采样；所述不确定性采样的公式为：其中，nB是贝叶斯神经网络对同一个样本点q进行预测的次数，fBq|WB是贝叶斯神经网络对样本q的预测，是网络对同一样本的多次预测的平均值；所述上置信界与不确定性结合采样的公式为：其中，qi是对应于fBq|WB的q误差；所述多样性采样是通过k-means聚类算法对数据进行聚类，然后从每个聚类中选择具有较大不确定性或上置信界值的样本；S4、对基数估计模型进行增量训练，具体为采用通过不确定性采样、上置信界与不确定性结合采样和二者结合的多样性采样得到的样本，分别对模型进行训练得到不同的模型，然后将多个模型结合起来形成集成模型；S5、利用得到的集成模型对数据库基数估计进行优化。

全文数据：

权利要求：

百度查询：电子科技大学一种基于注意力机制和数据感知的基数估计优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：路径规划方法、系统、设备及计算机可读存储介质

下一篇：光检测装置

相关技术

路径规划方法、系统、设备及计算机可读存储介质

光检测装置

情感分类模型训练方法、系统、情感分类方法及系统

高端计算机处理器用散热器及其制造方法

一种粗氨气净化及制取液氨的装置及方法

一种高纯锆靶材及其制备方法和应用

一种基于机场场面空地互联的虚拟交通灯系统

一种弹性卷材的放卷换卷机构

一种铸造用固化剂及其制备方法和使用方法

绿色重楼病虫害防治方法

适用于不同功能空间声场控制的音频处理系统及方法

一种稠油工况螺杆泵控制系统

感知相关技术

感知方法及装置_北京小米移动软件有限公司_202380008595.2

通信感知方法和装置、基站控制方法_中国电信股份有限公司技术创新中心_202411271515.5

基于舰船实例分割的港口全景感知系统_北京航空航天大学_202210194201.4

一种感知结果处理方法及装置_华为技术有限公司_202010924156.4

一种老年感知测试系统及测试方法_浙江大学_202411045499.8

用户感知速率确定方法、装置及存储介质_中国移动通信集团江苏有限公司_202110690948.4

基于跨网融合的路侧感知共享系统_重庆邮电大学_202410943001.3

用于感知检测的方法、设备及存储介质_北京三星通信技术研究有限公司_202310546172.8

用于感知上有意义的空间内容合成的方法和系统_杜比实验室特许公司_202380031349.9

一种皮肤痛觉感知测量用叩诊设备_滨州医学院烟台附属医院_202411058824.4

基数相关技术

一种基于注意力机制和数据感知的基数估计优化方法_电子科技大学_202410991235.5

一种多样本微孔式硅基数字PCR扩增检测的微流控芯片组件_上海驷格生物科技有限公司_202420378914.0

一种结构面不均匀分布的桥梁桩基数值模型构建方法_西南交通大学_202410847690.8

一种适用于棉田天敌瓢虫发生基数调查的无人机计数系统_塔里木大学_202410858793.4

数据查询方法、基数估计方法、数据查询模型训练方法、基于数据查询模型的信息处理方法及模型训练平台_阿里巴巴(中国)有限公司_202410668489.3

一种自适应多表连接基数估计的方法和系统_西北农林科技大学_202410844862.6

雷达基数据压缩方法、解码方法、设备、存储介质及产品_浙江宜通华盛科技有限公司_202411190915.3

一种基于卫星载荷处理的天基数据链消息反向订阅方法_中国电子科技集团公司第五十四研究所_202410898826.8

一种基于X波段相控阵雷达基数据的二次回波识别方法_中国气象局武汉暴雨研究所_202410699065.3

一种基数估计方法、装置及存储介质_中山大学_202410811527.6

估计相关技术

用于信道估计的发送空间信息_高通股份有限公司_202280093941.7

一种锂电池健康状态估计方法_浙江大学_202411463327.2

一种电池健康状态的估计方法_比亚迪股份有限公司_202110679383.X

位姿估计方法、装置、设备及介质_驭势科技(北京)有限公司_202210334193.9

用于近场操作的设备区域估计_高通股份有限公司_202380029894.4

用于货物感测估计的方法和系统_黑莓有限公司_201980036772.1

血压估计方法和生物体信息测定系统_株式会社村田制作所_202380031056.0

雷达底噪估计方法、装置、终端及存储介质_珠海正和微芯科技有限公司_202411114490.8

两阶段改进的森林高度估计方法_西南林业大学_202411422727.9

一种自动驾驶车辆线控执行系统延迟估计方法_苏州轻棹科技有限公司_202210296000.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于注意力机制和数据感知的基数估计优化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务