首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种中文句子的命名实体识别方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京邮电大学

摘要:本发明公开了一种中文句子的命名实体识别方法,包括:将中文字符序列输入识别模型,由识别模型通过字符嵌入层将中文字符序列转换为字向量并输出到识别模型中的卷积网络,卷积网络对每个字向量进行卷积运算得到局部语义向量并输出到识别模型中的自适应结合层,自适应结合层对字符的局部语义向量进行注意力计算后与对应字向量拼接得到表征向量并输出到识别模型中的序列建模网络,序列建模网络对字符的表征向量进行隐层建模并将建模得到的隐层向量输出到识别模型中的标签推理层计算字符的隐层向量对应的标签。通过卷积网络提取字符的局部语义信息后与潜在词基于字词间注意力实现字词信息融合,从而实现潜在词信息的利用,避免词边界错误传递的问题。

主权项:1.一种中文句子的命名实体识别方法,其特征在于,所述方法包括:将中文字符序列输入已训练的实体识别模型,以由本实体识别模型通过字符嵌入层将所述中文字符序列中的每个字符转换为字向量,并输出到本实体识别模型中的卷积网络,以由所述卷积网络对每个字向量进行卷积运算得到局部语义向量,并输出到本实体识别模型中的自适应结合层,以由所述自适应结合层对每个字符的局部语义向量进行注意力计算后与对应的字向量拼接得到表征向量,并输出到本实体识别模型中的序列建模网络,以由所述序列建模网络对每个字符的表征向量进行隐层建模,并将建模得到的隐层向量输出到本实体识别模型中的标签推理层计算每个字符的隐层向量对应的标签;获取所述实体识别模型输出的标签序列并作为命名实体识别结果;其中,所述自适应结合层对每个字符的局部语义向量进行注意力计算后与对应的字向量拼接得到表征向量,包括:接收本实体识别模型中潜在词嵌入层输出的每个字符对应的所有潜在词的词向量矩阵;针对每个字符,将该字符的局部语义向量与词向量矩阵进行注意力计算,并将注意力计算结果与该字符的字向量进行拼接得到该字符的表征向量;以及,所述潜在词嵌入层获取每个字符对应的所有潜在词的词向量矩阵,包括:将所述中文字符序列与预先构建的字典树进行匹配,以获得子字符串;将每个子字符串与已训练的词典进行匹配,以获取匹配成功的子字符串;将匹配成功的子字符串与其包含的字符进行关联,以得到每个字符的潜在词集合;针对每个字符,在词向量表中查询该字符的潜在词集合中每个潜在词的词向量以组成该字符的词向量矩阵。

全文数据:

权利要求:

百度查询: 北京邮电大学 一种中文句子的命名实体识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。