买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:国网江苏省电力有限公司信息通信分公司
摘要:本发明涉及数据处理技术领域,具体涉及一种知识本体信息的搜索方法,包括建立分析数据集,并基于分析数据集建立树状检索模型;提取查询请求中的索引号;将索引号输入树状检索模型进行检索,得到受控词;基于分析数据集建立相似度模型;将受控词输入相似度模型,得到多个拓展词;将受控词和多个拓展词整合,得到搜索结果,本发明通过对树状检索模型检索出的受控词进行概念拓展,得到了与受控词相关了拓展词,增加了搜索结果的范围,解决了现有的知识本体信息的搜索方法搜索结果的范围较窄,获取的信息量较少的问题。
主权项:1.一种知识本体信息的搜索方法,其特征在于,包括以下步骤:建立分析数据集,并基于所述分析数据集建立树状检索模型;提取查询请求中的索引号;将所述索引号输入所述树状检索模型进行检索,得到受控词;基于所述分析数据集建立相似度模型;将所述受控词输入所述相似度模型,得到多个拓展词;将所述受控词和多个所述拓展词整合,得到搜索结果;所述基于所述分析数据集建立相似度模型的具体方式为:利用语法解析对所述分析数据集进行解析,得到解析文本;通过文本概念拓展机制对所述解析文本进行拓展,得到拓展文本;对所述拓展文本和所述分析数据集的相似度进行加权计算,得到相似度模型;其中,通过文本概念拓展机制对所述解析文本进行拓展,得到拓展文本的具体方式为:利用外部知识库ConceptNet,找到不同概念间的联系,构建出以概念为节点,连边表示概念间的联系的常识知识图谱;利用一条文本中包含的概念的共现的频率,构建出以概念为节点,连边表示概念的共现概率的关联知识图谱,所述解析文本中包含的初始概念的节点值初始化为1,其他的节点则初始化为0;利用图注意力网络分别在所述常识知识图谱和关联知识图谱传播概念的响应值,分别得到补全常识知识图谱和补全关联知识图谱;将所述补全常识知识图谱和所述补全关联知识图谱加和,得到拓展文本;其中,将所述受控词和多个所述拓展词整合,得到搜索结果的具体方式为:分别根据每一所述拓展词与所述受控词的相似度对按照相似度由高至低对多个所述拓展词进行排序,得到拓展词组,对所述受控词进行标注后与所述拓展词组合并,得到搜索结果;所述建立分析数据集,并基于所述分析数据集建立树状检索模型的具体方式为:建立分析数据集;对所述分析数据集进行聚类分析,得到聚类结果;基于所述聚类结果从所述分析数据集中提取底层数据;基于所述底层数据构建树状检索模型;所述基于所述底层数据构建树状检索模型的具体方式为:基于所述底层数据对所述分析数据集进行树状排布,得到树状结构数据架;基于所述树状结构数据架生成索引表;将所述索引表对应至所述树状结构数据架上,得到树状检索模型。
全文数据:
权利要求:
百度查询: 国网江苏省电力有限公司信息通信分公司 一种知识本体信息的搜索方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。