南京邮电大学戴华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利一种面向关联数据集的差异度最大化数据表组合查询方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120045592B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510202473.8,技术领域涉及:G06F16/2455;该发明授权一种面向关联数据集的差异度最大化数据表组合查询方法是由戴华;解一鸣;周浩;李鹏越;陈燕俐;杨庚设计研发完成,并于2025-02-24向国家知识产权局提交的专利申请。
本一种面向关联数据集的差异度最大化数据表组合查询方法在说明书摘要公布了:本发明属于数据检索领域,公开了一种面向关联数据集的差异度最大化数据表组合查询方法,数据处理阶段首先对给定的表格数据集进行数据处理,建立特征‑数据列索引,根据该索引发现表格数据集中的可连接表,同时构建数据表连接图索引,预计算各表格之间的连接信息;数据查询阶段根据给定的样例查询表和连接列集合,在特征‑数据列索引中搜索候选连接列集合,获取候选数据表集合,根据给定预算,选取能够与样例查询表连接,并且使差异度最大的数据表集合。本发明首次提出了在关联数据集中搜索可连接数据表组合的方法,利用特征索引过滤可连接数据表,建立数据表连接图发现数据表之间的的连接路径,并返回预算约束下使差异度最大化的数据表集合。
本发明授权一种面向关联数据集的差异度最大化数据表组合查询方法在权利要求书中公布了:1.一种面向关联数据集的差异度最大化数据表组合查询方法,其特征在于:该方法是指在表格数据集C中查询与Tq在指定的连接列集合Q上满足多属性连接条件,并使差异度最大化的数据表组合,包括数据处理阶段和数据查询阶段,设表格数据构成的表格数据集记为C={T1,T2,…Tn},Tq为查询样例数据表,指定的连接列集合Q={q1,q2,…,qm},具体为: 第一阶段:数据处理阶段,具体包括如下步骤: 步骤1.1、针对表格数据集C中的每一个数据表Ti,根据每一列的数据类型,提取每一列的特征集合Fi,j,针对表格数据集C,对于每一种特征类型fl,构建特征-数据列索引Il,进而构建特征-数据列索引集合 步骤1.2、对于表格数据集C中的每个数据表Ti,基于特征-数据列索引集合根据数据表Ti的各个数据列cj在表格数据集C中满足相似度阈值θ的所有数据列,进而构成数据表Ti的候选连接集合Ri={Tk,cx,FKcx|cx∈Ti,FKcx∈Tk,ecx,FKcxθ},其中FKcx表示列cx在候选表Tk中的可连接列,e为列匹配分数计算函数,对候选连接集合Ri中的每一个候选表Tk,选取一组最佳连接Tk,cx,FKcx,并删除候选连接集合Ri中数据表Ti与候选表Tk的其他连接; 步骤1.3、针对表格数据集C,根据表格数据集C中每一个数据表Ti的候选连接集合Ri,使用图数据库构建一张表示表格数据集C中各表格之间连接关系的图索引G; 第二阶段:数据查询阶段,具体包括如下步骤: 步骤2.1、根据给定的查询样例数据表Tq和连接列集合Q,对连接列集合Q中的每一个特征-数据列索引集合中检索满足相似度阈值θ的所有数据列,进而构建查询样例数据表Tq的样例候选连接集合Rq; 步骤2.2、根据样例候选连接集合Rq,获取所有能够在连接列集合Q的所有数据列上与查询样例数据表Tq可连接列的,在图索引G中存在连接路径,并且满足的数据表组合pk,进而构建候选数据表组合集合其中PCk是所有能够连接数据表组合pk中所有数据表的连接路径所构成的集合; 步骤2.3、根据候选数据表组合集合PTq中的每一个数据表组合pk和pk对应的连接路径集合PCk,获取数据表组合pk与查询样例数据表Tq的差异行元组集合DiffTq,pk,具体包括如下步骤: 步骤2.3.1、对于连接路径集合PCk中的每一条连接路径pathx,依次选取连接路径pathx中包含的边Ti,Tj并连接数据表Ti、Tj,连接条件和连接方式如下: 进而获取连接路径pathx上所有数据表组合后在连接列集合Q上的行元组集合PTpathx: 其中|Vpathx|表示该路径上的顶点数量; 步骤2.3.2、根据连接路径集合PCk中每一条路径上形成的行元组集合PTpathx,计算取数据表组合pk与查询样例数据表Tq的差异行元组集合: 步骤2.4、根据给定预算B,查找候选数据表组合集合PTq的一个子集RP,使子集RP满足以下条件: 进而构建结果集R={pk,PCk|p∈RP},并返回结果集R。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210046 江苏省南京市栖霞区广月路30-06号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励