Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于WordNet的关系数据库本体构建方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州费尔斯通科技有限公司

摘要:本发明公开了一种基于WordNet的关系数据库本体构建方法,首先计算WordNet中每个元素synset的TF‑IDF向量,然后抽象出关系数据库DB的结构并获取DB中每个表中文名和字段中文名在WordNet中的候选synsets,计算权重确定最终的synset,初始化集合TBox和集合Concept,将最终的synset放入Tbox和Concept中并根据Concept扩充Tbox,DB本体化后的本体结构。本发明利用句法依存分析的结果和候选synset之间的语义关系解决了候选synset唯一化的问题,同时依托于WordNet和synset上位词扩充保证所得本体结构的合理性与完整性。

主权项:1.一种基于WordNet的关系数据库本体构建方法,其特征在于,该方法具体步骤如下:1计算WordNet中每个元素synset的TF-IDF向量;2抽象出关系数据库DBDataBase的结构;a集合T={tablei,{filedik,typeik}},T中的第i个元素tablei,{filedik,typeik}代表关系数据库的一张表,tablei是表中文名,filedik是第i个表的第k个字段中文名,而typeik是filedik的数据类型;b集合R={tablei,fieldik,tablej},R中的每个元素tablei,fieldik,tablej表示tablei中的字段fieldik是tablei到tablej的外键。3获取DB中每个表中文名和字段中文名在WordNet中的候选synsets:先将表中文名和字段中文名翻译成英文,通过句法依存分析得到查询队列query_terms,然后在WordNet中查询候选synset,作为表或者字段的上位词;4根据每个候选synset的TF-IDF向量,计算步骤3中每个候选synset的权重:并将权重取得最大值时的候选synset作为最终的synset;计算每个候选synset的权重具体过程如下:aweighttable_synsetih=∑k,lsimtable_synsetih,field_synsetiklb 其中,simtable_synsetih,field_synsetikl=α×lang_simtable_synsetih,field_synsetikl+1-α×token_simtable_synsetih,field_synsetikl 其中,α取值为0.6;lang_simtable_synsetih,field_synsetikl为WordNet提供的lin_similarity函数;定义两个向量之间的点积运算“·”为两个向量对应分量乘积组成的向量;|·|的含义为:定义一个向量vector,则5初始化术语集合TBoxTerminologyBox和概念集合Concept,进行以下过程:a针对每个tablei,将concepttablei加入Concept中,若concepttablei对应的is_hypernymih为True;i.建立概念concepti,其概念名为table_eni,并将table_concepti,isSubclassOf,concepttablei加入TBox;isSubclassOf表示左边参数是右边参数的子类,即table_concepti为concepttablei的子类;ii.否则concepti=concepttablei;b针对每个fieldik,若conceptfieldik对应的is_hypernymik为True,propertyik=field_enik;否则propertyik=lemmaconceptfieldik;lemma为WordNet提供的lexname函数;c将propertyik,domain,concepti加入TBox中;domain代表领域,即propertyik的领域是concepti;d若fieldik存在于R中的某个元素tablei,fieldik,tablej中,将propertyik,range,conceptj加入TBox中;否则,将propertyik,range,typeik加入TBox中。6根据Concept扩充TBox:对于Concept中的每个concepti,在WordNet中找到其上位词hypernymi,将concepti,isSubclassOf,hypernymi加入TBox中,同时对hypernymi的上位词hypernymii进行相同的操作,而hypernymii亦是如此,直到触及WordNet中的根synset为止。扩充后TBox便是DB本体化后的本体结构。

全文数据:

权利要求:

百度查询: 杭州费尔斯通科技有限公司 一种基于WordNet的关系数据库本体构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。