Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于隐含超类挖掘的本体生成方法、装置和设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京大数据先进技术研究院

摘要:本申请提供了一种基于隐含超类挖掘的本体生成方法、装置和设备,涉及数据处理技术领域,该方法包括:从关系数据库中获取待处理的多个关系数据表;提取多个关系数据表中各个数据列的列名称,获取每个列名称在多个关系数据表中的出现次数信息;根据出现次数信息,确定目标列名称,目标列名称表示集中出现在多个关系数据表中的高频列名称;根据目标列名称,从多个关系数据表中确定子类关系数据表;将目标列名称所对应的数据列作为隐含超类所具有的数据列,将子类关系数据表所对应的类,作为隐含超类的子类;隐含超类表征多个关系数据表之间的主要特征;根据隐含超类,生成针对多个关系数据表的关系型数据本体。

主权项:1.一种基于隐含超类挖掘的本体生成方法,其特征在于,所述方法包括:从关系数据库中获取待处理的多个关系数据表;提取所述多个关系数据表中各个数据列的列名称,获取每个列名称在所述多个关系数据表中的出现次数信息;根据所述出现次数信息,确定目标列名称,所述目标列名称表示集中出现在所述多个关系数据表中的高频列名称;根据所述目标列名称,从所述多个关系数据表中确定子类关系数据表;将所述目标列名称所对应的数据列作为隐含超类所具有的数据列,将所述子类关系数据表所对应的类,作为所述隐含超类的子类;所述隐含超类表征所述多个关系数据表之间的主要特征;根据所述隐含超类,生成针对所述多个关系数据表的关系型数据本体;根据所述出现次数信息,确定目标列名称,包括:根据所述出现次数信息,排除各个数据列的列名称中的干扰列名称;将剩余的列名称按照出现次数从高到低的顺序,进行排列,得到候选序列;对于所述候选序列中的任一列名称,获取其相邻的两个列名称,组成候选数组;按照出现次数从高到低的顺序,依次计算每个候选数组的标准差;根据每个所述候选数组的标准差,将满足第一条件的候选数组中的列名称确定为所述目标列名称;所述干扰列名称至少包括:第一干扰列名称和第二干扰列名称,根据所述出现次数信息,排除各个数据列的列名称中的干扰列名称,包括:根据所述出现次数信息,将出现次数大于或等于最高出现次数阈值的列名称,作为第一干扰列名称排除;根据所述出现次数信息,将出现次数为1的列名称,作为第二干扰列名称排除;根据所述目标列名称,从所述多个关系数据表中确定子类关系数据表,包括:将所述目标列名称所对应的数据列放入目标数组中;计算所述多个关系数据表中,每个关系数据表所包含的所述目标数组中的数据列的列数量;将列数量大于或等于预设列数量阈值的关系数据表,确定为所述子类关系数据表;所述根据所述隐含超类,生成针对所述多个关系数据表的关系型数据本体,包括:对于所述多个关系数据表,分别创建对应的本体类;根据所述隐含超类,创建所述隐含超类和所述子类关系数据表所对应的实体类之间的父子类关系;为所述隐含超类的每个数据列在对应的本体中创建一个同名数据属性,使其定义域为所述隐含超类,其值范围为该数据列的SQL数据类型;对于每个所述关系数据表中的主键,为主键内的每个数据列,在本体中创建一个同名数据属性,使其定义域为对应的本体类,其值范围为该数据列的SQL数据类型。

全文数据:

权利要求:

百度查询: 北京大数据先进技术研究院 基于隐含超类挖掘的本体生成方法、装置和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。