首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于神经网络的多信息融合命名实体识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津大学

摘要:本发明涉及一种基于神经网络的多信息融合命名实体识别方法,包括以下步骤:步骤一,对于包含实体信息的输入文本,转化成将文本长度为n并包含实体信息的文本序列,通过预训练模型BERT获取文本特征向量;通过匹配的方式将文本长度为n并包含实体信息的文本序列转换成对应的文字图片;步骤三,将步骤二得到的图片经过卷积模块提取特征;步骤四,将步骤一和步骤三分别提取的文本特征和图像特征拼接后得到完整的融合特征;步骤五,通过融合特征来构建标注矩阵;步骤六,基于标注矩阵实现命名实体识别。

主权项:1.一种基于神经网络的多信息融合命名实体识别方法,包括以下步骤:步骤一,对于包含实体信息的输入文本,转化成将文本长度为n并包含实体信息的文本序列,通过预训练模型BERT获取文本特征向量,输出的文本特征向量表示为其中n代表文本长度,k代表每个字的文本特征向量的维度;步骤二,通过匹配的方式将文本长度为n并包含实体信息的文本序列转换成对应的文字图片,每个字转换一张通道数为1的灰度图,如果某个字不存在BERT字表中对应的ID,则转换为一张全0的灰度图;步骤三,将步骤二得到的图片经过卷积模块提取特征;所述的卷积模块包括3D卷积块和多个2D卷积块,分别用来提取图像不同维度的信息,提取特征方法如下:1经过3D卷积块以提取到文字图片的深度信息,操作如下:使用2个卷积核大小为3×3×3的3D卷积层将步骤二得到的文字图片映射到8通道的特征空间;2将3D卷积块的输出分别依次经过4个2D卷积块以提取文字图片的宽度和广度信息,每个2D卷积块包含一个卷积层和一个最大池化层,第一个2D卷积块的卷积核大小为3×3,池化层大小为2×2,后面依次经过3个卷积核大小为2×2,池化层大小为2×2的2D卷积模块,得到最后的特征步骤四,将步骤一和步骤三分别提取的文本特征和图像特征拼接后得到完整的融合特征步骤五,通过融合特征来构建标注矩阵;标注矩阵可以很好的解决实体重叠问题,在构建标注矩阵时,由于实体的头一定在实体的尾前面;所以,整个标注矩阵只需要构建上半个就可以了,即一个矩阵的上三角部分,从而减少计算资源的使用;标注矩阵的构建如下:已知,文本特征和图像特征融合后为对应标注矩阵的第一行为表示取的所有行的所有列,第二行为表示取的第2到n行的所有列…,以此类推,直到最后一行为表示取的最后一行的所有列,将其拼接到一起得标注矩阵Ln+n-1+n-2+...+1×k+d;步骤六,基于标注矩阵实现命名实体识别。

全文数据:

权利要求:

百度查询: 天津大学 基于神经网络的多信息融合命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。