首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于图注意力网络的中文命名实体识别方法和系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖南大学

摘要:本发明公开了一种基于图注意力网络的中文命名实体识别方法,包括以下步骤:获取待中文命名实体识别的中文语句,基于得到的中文语句构建中文语句对应的字向量集合X,将得到的中文语句对应的字向量集合X输入训练好的基于图注意力网络的中文命名实体识别模型中,以得到该中文语句对应的中文命名实体标注。本发明能够解决现有BiLSTM‑CRF模型中存在的单词边界与实体边界不一致、模型输入特征单一的技术问题,以及现有基于图注意力网络的协同图网络模型中存在的传统图注意力计算方法损害图注意力表达能力的技术问题。

主权项:1.一种基于图注意力网络的中文命名实体识别方法,其特征在于,包括以下步骤:1获取待中文命名实体识别的中文语句;2基于步骤1得到的中文语句构建中文语句对应的字向量集合X;3将步骤2得到的中文语句对应的字向量集合X输入训练好的基于图注意力网络的中文命名实体识别模型中,以得到该中文语句对应的中文命名实体标注;步骤3中基于图注意力网络的中文命名实体识别模型是通过以下步骤训练得到的:3-1获取采用BIOES标记方案标注好的中文命名实体识别数据集,将中文命名实体识别数据集中每个中文语句的文本映射成字向量,以得到中文命名实体识别数据集中每个中文语句对应的字向量集合;步骤3-1包括以下步骤:3-1-1获取多个领域的中文命名实体识别数据集,使用BIOES标记方案标注中文命名实体识别数据集,以得到标注后的中文命名实体识别数据集;3-1-2基于步骤3-1-1得到的标注后的中文命名实体识别数据集,构建中文命名实体识别数据集中每个中文语句对应的字向量集合X;3-2将步骤3-1得到的中文命名实体识别数据集中每个中文语句对应的字向量集合输入到双向长短时记忆BiLSTM模型中,以得到字向量的初步特征向量,再将字向量的初步特征向量输入到改进后的图注意力网络GAT模型中,以得到中文语句对应的最终特征向量;步骤3-2具体包括以下子步骤:3-2-1针对步骤3-1得到的中文命名实体识别数据集中每个中文语句对应的字向量集合X中的每个字向量而言,使用BiLSTM模型对其进行初步建模,以得到前向和后向两个不同的特征表示,并将这两个特征表示进行拼接,以得到包含上下文特征的该字向量对应的中文语句特征向量,该中文语句对应的字向量集合所对应的中文语句特征向量构成该中文语句对应的中文语句特征向量集合H={h1,h2,…,hm},其中m∈[1,中文语句中字符的总数量M];3-2-2利用步骤3-1得到的中文命名实体识别数据集中每个中文语句对应的字向量集合构建该中文语句对应的单词-字符交互图G=V,E;其中V是节点集合,节点集合包括中文语句对应的字向量集合中所有的字符和自匹配词;E是边集合,边包括了字向量集合中字符与字符之间的连接关系、字符与自匹配词之间的包含关系、自匹配词之间的连接关系;3-2-3根据步骤3-2-1得到的中文语句对应的中文语句特征向量集合H和步骤3-2-2中构建的该中文语句对应的单词-字符交互图G获取该中文语句对应的字词信息融合相关系数矩阵e;3-2-4对步骤3-2-3得到的中文语句对应的字词信息融合相关系数矩阵e中的每个元素ehi,hj进行归一化处理,以得到该中文语句对应的单词-字符交互图G中两两节点之间的注意力系数αij;3-2-5基于步骤3-2-4得到的中文语句对应的单词-字符交互图G中两两节点之间的注意力系数αij,采用基数保留的图注意力网络计算方法,获取该中文语句对应的单词-字符交互图G中每个节点的特征向量ki,该中文语句对应的单词-字符交互图G中所有节点的特征向量ki构成该中文语句对应的单词-字符交互图G对应的特征向量集合K;3-2-6将步骤3-2-5得到的中文语句对应的单词-字符交互图G对应的特征向量集合K与步骤3-2-1得到的该中文语句对应的中文语句特征向量集合H进行加权求和,以得到该中文语句对应的最终特征向量R=W1H+W2K,其中W1与W2为可训练的矩阵;3-3将步骤3-2得到的中文语句对应的最终特征向量输入条件随机场模型进行解码,以得到中文语句对应的中文命名实体标注,使用标注结果计算基于图注意力网络的中文命名实体识别模型的损失函数并训练BiLSTM模型、GAT模型的各参数,以得到训练好的基于图注意力网络的中文命名实体识别模型,其包含步骤3-2中的BiLSTM模型、GAT模型与步骤3-3中的条件随机场模型。

全文数据:

权利要求:

百度查询: 湖南大学 一种基于图注意力网络的中文命名实体识别方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。