买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:国电电力发展股份有限公司北京分公司
摘要:本发明提供的一种文字信息碎片整合方法,涉及信息整合处理技术领域,其特征在于,包括以下步骤:步骤1、获取相应信息数据后分别进行信息分析与数据挖掘;步骤2、将步骤1中提取出的知识单元进行结构化加工,形成用XML表示的内容资源包,随后使用标引工具对内容进行标引数据处理;步骤3、将步骤2中XML资源包进行自然语言处理,所述自然语言处理包括新词发现、实体识别和关系抽取;步骤4、将步骤3中完成处理的文件结合知识图谱进行智能搜索,所述智能搜索会提取出相应的关键词以及表单信息等,随后通过匹配处理后进行结果展示。本发明的优点:文字信息识别精度高,方便整合管理。
主权项:1.一种文字信息碎片整合方法,其特征在于,包括以下步骤:步骤1、获取相应信息数据后分别进行信息分析与数据挖掘,把结构化的文献按照知识体系定义的颗粒度,提取出有意义的知识单元,并归入知识体系的架构中,完成初步处理;步骤2、将步骤1中提取出的知识单元进行结构化加工,形成用XML表示的内容资源包,随后使用标引工具对内容进行标引数据处理;步骤3、将步骤2中XML资源包进行自然语言处理,所述自然语言处理包括新词发现、实体识别和关系抽取,所述新词发现将处理后的数据与资料库中已有语料结合进行挖掘,从而识别出新词;所述实体识别会抽取文本中的信息元素,所述信息元素包括人名、组织或机构名、地理位置、时间或日期、字符值和相关领域专有名词等;所述关系抽取在识别出关键实体后会抽取实体之间的语义关系,并识别相应文本的主要含义;步骤4、将步骤3中完成处理的文件结合知识图谱进行智能搜索,所述智能搜索会提取出相应的关键词以及表单信息等,随后通过匹配处理后进行结果展示。
全文数据:
权利要求:
百度查询: 国电电力发展股份有限公司北京分公司 一种文字信息碎片整合方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。