买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:鹏城实验室
摘要:本发明属于领域词典构建技术领域,公开了一种垂直工业领域实体词典构建方法、装置、设备及存储介质。该方法包括:获取目标垂直工业领域的文本数据知识,对文本数据知识进行预处理,得到文本语料;基于预训练的工业实体词汇识别模型,对文本语料进行实体识别,确定语句实体词汇;基于语句实体词汇与实体词汇关系规则模板,生成词汇三元组;基于词汇三元组与知识图谱中的已知三元组,确定新增信息,并将新增信息添加进词典中,形成树状分类词典;基于领域层级关系,对树状分类词典进行编码,得到多层级树状分类实体词典。通过上述方式,自动对工业垂域实体词汇进行分层分类,可以持续对领域词典进行扩充,提高工业知识抽取的效率和准确率。
主权项:1.一种垂直工业领域实体词典构建方法,其特征在于,所述垂直工业领域实体词典构建方法,包括:获取目标垂直工业领域的文本数据知识,对所述文本数据知识进行预处理,得到文本语料;基于预训练的工业实体词汇识别模型,对所述文本语料进行实体识别,确定语句实体词汇;基于所述语句实体词汇与实体词汇关系规则模板,生成词汇三元组;基于所述词汇三元组与知识图谱中的已知三元组,确定新增信息,并将所述新增信息添加进词典中,形成树状分类词典;基于领域层级关系,对所述树状分类词典进行编码,得到多层级树状分类实体词典。
全文数据:
权利要求:
百度查询: 鹏城实验室 垂直工业领域实体词典构建方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。