一种基于最小属性割的分布式SPARQL查询优化方法

导航：龙图腾网> 最新专利技术> 一种基于最小属性割的分布式SPARQL查询优化方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：湖南大学

摘要：本发明公开了一种基于最小属性割的分布式SPARQL查询优化方法，属于分布式系统领域，其包含步骤：1读取原始RDF数据图，保存边属性集合L；2计算每个边属性的弱连通分量及相应的代价；3尽可能多地选择内部属性，得到数据图的粗化图；4对粗化图进行顶点划分，并且反粗化处理，得到最终分区；5将SPARQL查询分解成一组可独立执行的子查询；6各个分区内并行执行分解后的子查询，获得匹配结果。本发明扩展了分布式RDF系统中可独立执行的查询类型，减少分区间的连接，降低数据通信时间，提升查询效率。

主权项：1.一种基于最小属性割的分布式SPARQL查询优化方法，其特征在于，包含如下步骤：1读取原始RDF数据图，保存边属性集合L；2计算每个边属性的弱连通分量及相应的代价；步骤具体包含：S2.1：遍历集合L中每个属性p，对属性p分别执行步骤S2.2～S2.4；S2.2：为属性p初始化一个并查集DS{p}；在并查集中，每个节点u对应着一棵树，并且含有三个属性值u{p}.parent，u{p}.rank和u{p}.size；其中，u{p}.parent是u在DS{p}中的根节点，初始值为u本身；u{p}.rank是u节点到根节点的高度值，初始值为0；u{p}.size是树中根顶点的数量，初始值为1；S2.3：对于RDF图中的边对应的树可以合并，即包含u和u′的弱连通分量可以合并；在合并过程中，rank更小的树的根顶点指向rank更大的树的根顶点；当所有属性为p的边被处理完之后，如果属性p的诱导子图G[{p}]中两个顶点在同一个弱连通分量中，则这两个顶点在并查集DS{p}中也处于同一棵树；这里，所谓弱连通分量是指在有向图中通过视边为无向边后能够形成的连通区域；S2.4：以RDF数据图中u{p}.size最大值作为属性p被选为为内部属性的代价，这个就是u{p}.size就是属性p的诱导子图G[{p}]里面最大的弱连通分量的大小；3尽可能多地选择内部属性，得到数据图的粗化图；步骤具体包含：S3.1：将内部属性集合Lin初始化为空；S3.2：判断属性集合L是否为空，若集合L为空，则结束迭代进入S3.9；否则，分别执行步骤S3.3～S.3.8，继续下一轮迭代；S3.3：最小代价mincost设置为无穷大，最优属性popt设置为空；S3.4：遍历属性集合L，对属性p分别执行步骤S3.5、S3.6；S3.5：计算WCCG[Lin∪{p}]，也就是Lin∪{p}中属性的诱导子图G[Lin∪{p}]的弱连通分量集合；为了提高弱连通分量的计算效率，使用并查集数据结构进行优化；初始时，将并查集DSLin∪{p}设置成DSLin；对于DS{p}中的顶点u，可以通过递归方式获取到DS{p}对应树的根顶点uRoot；之后，在DSLin∪{p}中分别获取到u和uRoot的根顶点，如果u和uRoot的根顶点不一样，则合并对应的树；S3.6：如果costLin∪{p}小于1+ε×|V|k，并且同也小于mincost，则将CostLin∪{p}赋值给mincost、p赋值给popt，之后转入步骤S3.4；否则，mincost和popt保持不变，直接转入步骤S3.4；S3.7：如果经过步骤S3.4～S3.6之后，最优属性popt依旧为空，则结束步骤S3，转入步骤S4；否则，转入步骤S3.8；S3.8：从属性集合L中删除属性popt，然后将popt添加到内部属性集合Lin，之后转入步骤S3.2继续选择内部属性；S3.9：针对上述求得的节点集合Lin，我们进一步构建其对应的诱导子图G[{Lin}]，并在此基础上进行一种特定的图粗化处理；具体而言，我们首先识别G[{Lin}]中的所有弱连通分量，随后将这些弱连通分量各自视为一个单一的超点即，将每个弱连通分量内的所有节点合并为一个更高级别的节点；接下来，如果原图中任意两个弱连通分量之间存在至少一条边，则在它们所对应的超点之间连接一条超边；通过这一系列操作，我们成功地将原图转化为一个粗化图，其中节点和边的数量显著减少，但保留了原图中关于弱连通分量之间连接关系的重要信息；4对粗化图进行顶点划分，并且反粗化处理，得到最终分区；步骤具体包含：S4.1：将粗化图中超点内部的顶点数量作为超点的权重，从而对粗化图使用带权的哈希划分，确保最终数据分区的顶点数量不超过1+ε×|V|k；S4.2：将步骤S4.1中划分到同一个分区的超点集合反粗化成最终的一个分区，即将超点集合中包含的原始数据点划分为原始数据图中的一个分区；5将SPARQL查询分解成一组可独立执行的子查询；步骤具体包含：S5.1：初始化一个空集合Q，该集合用于存储分解后的子查询；S5.2：删除SPARQL查询中边属性为变量或跨越属性的边，得到一组弱连通分量{q'1,q'2,...,q'y}，这里设对于v1点所在的查询为qv1；S5.3：遍历SPARQL查询中边属性为变量或跨越属性的边对该边执行步骤S5.4～S5.5；S5.4：如果v1和v2属于同一个子查询，则在它们所在的子查询中添加边之后转入步骤S5.3继续新一轮迭代；否则，转入步骤S5.5；S5.5：如果|qv1|小于等于|qv2|，则将边添加到qv2中，否则添加到qv1中，即将边添加到v1和v2所属子查询中顶点较多的子查询内；之后，转入步骤S5.3继续新一轮迭代；S5.6：遍历WCCs中的子查询q，如果q中的顶点数量大于1，则将q加入到集合Q中；此处，不考虑顶点数量为1的查询是因为：此类查询只含有一个查询点，匹配结果数量较多且无意义，并且其它查询会包含该查询点；6各个分区内并行执行分解后的子查询，获得匹配结果；步骤具体包含：S6.1：分布式RDF系统的主节点将分解后的子查询广播给所有从节点，当从节点接收到子查询后，分区内部开始并行地执行子图匹配，获得中间匹配结果；S6.2：对各个节点中的中间匹配结果进行分区间连接，获得最终的匹配结果，并将结果汇集到主节点中。

全文数据：

权利要求：

百度查询：湖南大学一种基于最小属性割的分布式SPARQL查询优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种红松生长影响因素获取系统

下一篇：一种除湿机热源自动切换控制方法及装置

相关技术

一种红松生长影响因素获取系统

一种除湿机热源自动切换控制方法及装置

站隧合建宽大基坑桩撑一体化支护结构

局域共振型声子晶体原胞

一种基于多链融合的药品溯源系统和方法

一种装饰条连接件与立柱压板的连接工艺

温度控制方法、装置、系统及计算机设备

一种绝缘纸生产强度性能检测装置

一种节能建筑屋顶结构及施工方法

一种生态水循环三角集成装置

基于城市地理信息数据与多维属性数据的智能规划审查方法

一种热电芯片的制作方法

SPARQL相关技术

针对SPARQL查询基于粒度块的并行处理方法、装置_中国科学院空天信息创新研究院_202410798488.0

基于大语言模型的缝纫工艺SPARQL查询方法_杭州橙织数据科技有限公司_202411035205.3

一种基于离散樽海鞘算法的SPARQL查询优化方法_重庆邮电大学_202311863839.3

一种SPARQL联合查询的数据源选择方法_广东粤通天下科技有限公司_202110065571.3

一种基于Sparql语句生成的知识图谱问答方法和系统_之江实验室_202211609811.2

在分布式图数据库中优化SPARQL查询_达索系统公司_202211631110.9

在SPARQL查询引擎中处理逻辑规则_达索系统公司_202211610024.X

一种基于SPARQL端点联合的动态连接排序方法_首都师范大学_202110051652.8

一种知识驱动的SPARQL查询构建方法_智言科技(深圳)有限公司_201910282147.7

基于VF2算法的SPARQL查询子图模式匹配方法_之江实验室_202211712045.2

优化相关技术

基于优化和非优化控制器例程的风力涡轮机控制_维斯塔斯风力系统集团公司_201980092269.8

配电网的优化调度方法、装置和配电网优化系统_南方电网科学研究院有限责任公司_202410765425.5

一种基于改进人工兔优化算法的随机共振系统优化的方法_桂林电子科技大学_202410832771.0

基于可配置逻辑的数据传输性能优化硬件实现及优化流程_鹏钛存储技术(南京)有限公司_202410788970.6

基于群体协同算法优化中药配方配比的可行性优化方法_山西医科大学第一医院_202410731482.1

基于业财融合的税利测算模型的优化系统及优化方法_中国烟草总公司四川省公司_202410936519.4

优化器和光伏发电系统_阳光电源(上海)有限公司_202420289499.1

一种汽车生产优化方法_安徽江淮汽车集团股份有限公司_202410839414.7

优化Conformer的推理性能_谷歌有限责任公司_202280073371.5

一种行车优化机构_上海涵优电子科技有限公司_202420108185.7

割相关技术

一种割台传动系统及收割机割台_常州常发重工科技有限公司_202410825018.9

蜂窝纸板割样工作台_黄山学院_202322825141.4

一种煤矿掘进截割头防护装置_沁水县鑫海能源有限责任公司_202322970971.6

一种割边机的防护装置_杭州桃李绣品有限公司_202420334503.1

一种高效稳定高粱割台_齐齐哈尔农垦红星农业机械制造有限公司_202420155925.2

具备防割功能的碳纤维鞋垫_东莞市猴波鞋业有限公司_202322976697.3

一种工程安装用割管设备_甘肃一安建设科技集团有限公司_202420283849.3

一种具有收卷机构的电脑提花割圈绒机_无锡市佳龙纺织机械有限公司_202420039563.0

包装箱供箱割带一体机_无锡众创自动化科技有限公司_202411126800.8

一种掘进机截割头防护装置_王凯_202323342452.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于最小属性割的分布式SPARQL查询优化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务