买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:国网安徽省电力有限公司
摘要:本发明公开了一种配电网故障文本实体识别方法,属于文本实体识别技术领域。配电网故障文本实体识别方法包括以下步骤:采用SpanBERT对原始获得的配电网故障文本数据进行训练,获得配电网领域SpanBERT模型;采用配电网领域SpanBERT模型对经过基于字典匹配自动构建标注的配电网故障文本数据和原始获得的配电网故障文本数据进行联合训练得到特征向量;将特征向量和经过双向长短期记忆网络处理得到的拼音向量进行融合得到多特征融合向量;提出新的打分函数对现有的仿射网络进行了改进,进行实体识别。本发明采用上述配电网故障文本实体识别方法,解决了依赖于大量的标注数据进行训练、嵌套的命名实体识别以及非连续的命名实体识别困难和指代消解的问题。
主权项:1.一种配电网故障文本实体识别方法,其特征在于:包括以下步骤:S1、采用SpanBERT对原始获得的配电网故障文本数据进行训练,获得配电网领域SpanBERT模型;S2、采用配电网领域SpanBERT模型对经过基于字典匹配自动构建标注的配电网故障文本数据和原始获得的配电网故障文本数据进行联合训练得到特征向量;S3、将特征向量和经过双向长短期记忆网络处理得到的拼音向量进行融合得到多特征融合向量;S4、提出新的打分函数对现有的仿射网络进行了改进,得到改进的双仿射网络,进行实体识别。
全文数据:
权利要求:
百度查询: 国网安徽省电力有限公司 一种配电网故障文本实体识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。