首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种藏医药领域实体关系联合抽取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西藏大学

摘要:本发明提出了一种藏医药领域实体关系联合抽取系统及方法,涉及人工智能领域。一种藏医药领域实体关系联合抽取方法包括以下步骤:获取藏医药相关文字样本,作为训练样本;将训练样本转换为词向量;对训练样本分类,并将分类结果和词向量融合,得到静态融合特征;构建双元动态模型,将静态融合特征送入双元动态模型,得到最终的预测标签序列;计算双元动态模型的损失值,更新参数,得到更新后的双元动态模型;使用更新后的双元动态模型进行实体关系联合抽取。本发明可以标注嵌套实体,修正模型的标签分类结果,提高预测准确性;使用动态特征融合增强实体边界,使得模型可以较好地识别实体及关系,提高了系统鲁棒性及有效性。

主权项:1.一种藏医药领域实体关系联合抽取方法,其特征在于,包括以下步骤:S1、获取藏医药相关文字样本,作为训练样本;S2、将训练样本转换为词向量,记为bs,seq_len,dim1;其中,bs为批次大小;seq_len为句子长度;dim1为词向量特征维度;S3、对训练样本分类,并将分类结果和词向量进行融合,得到静态融合特征;S4、构建双元动态模型,将静态融合特征送入双元动态模型,得到最终的预测标签序列;S5、计算双元动态模型的损失值,更新参数,得到更新后的双元动态模型;S6、使用更新后的双元动态模型进行实体关系联合抽取;步骤S3包括以下步骤:S3-1、将训练样本分为药材、方剂、诊疗方法三个类别,得到分类结果,作为训练样本的类别特征;S3-2、根据训练样本的类别特征对训练样本中的每一个数据向量化,得到向量化的样本数据;记为bs2,seq_len2,dim2;其中,bs2为向量化的样本数据的批次大小;seq_len2为向量化的样本数据的句子长度;dim2为向量化的样本数据的类别特征维度;S3-3、将向量化的样本数据和词向量融合,得到静态融合特征,记为bs3,seq_len3,dim1+dim2;其中,bs3为静态融合特征的批次大小;seq_len3为静态融合特征的句子长度;dim1+dim2为静态融合特征的融合特征维度;步骤S4包括以下步骤:S4-1、将静态融合特征送入静态特征学习模块,得到预测标签序列;S4-2、将预测标签序列和静态融合特征送入多特征动态融合层,得到总体融合特征;S4-3、将总体融合特征送入动态特征学习模块,得到最终的预测标签序列;步骤S4-1包括以下步骤:S4-1-1、将静态融合特征送入BiLSTM编码层,得到编码后的静态融合特征;S4-1-2、使用Dropout函数对编码后的静态融合特征进行处理,得到处理后静态融合特征;S4-1-3、使用线性分类层将处理后静态融合特征的维度映射到标签维度,得到映射后的静态融合特征;S4-1-4、根据得到映射后的静态融合特征通过奖惩机制层计算全局最优标签;S4-1-5、将全局最优路径输入标记分数层,获取约束标签;S4-1-6、将约束标签输入CRF解码层,获得预测标签序列;步骤S4-3中动态特征学习模块和静态特征学习模块结构相同;步骤S4-1-4包括以下步骤:S4-1-4-1、根据得到映射后的静态融合特征计算训练样本的每一个路径的得分;S4-1-4-2、根据公式: 得到CRF奖惩机制层的损失值loss;其中,Px|y表示当前路径为正确路径的概率;eSx,y′表示当前正确路径的分数;表示当前每种路径可能分数的总和;i表示第i个路径,n表示共有n个路径;Sx,y′表示正确路径所获得的分数,y′表示当前路径为正确路径;x表示实体;S4-1-4-3、设立奖惩机制并使用CRF解码层的损失值loss反向传播,修改CRF奖惩机制层参数,得到修改后的CRF奖惩机制层;S4-1-4-4、使用修改后的CRF奖惩机制层计算全局最优路径;步骤S4-2包括以下步骤:S4-2-1、将预测标签序列送入分词信息提取器,根据预测标签构建针对实体的分词信息;其中,将实体起始位置的分词信息标注为1,实体结束位置的分词信息标注为3,实体中间位置的分词信息标注为2;对于非实体,将其分词信息标注为0;S4-2-2、将预测标签序列送入位置信息提取器,根据标签构建针对实体的位置信息;S4-2-3、将分词信息和位置信息融合,得到动态融合特征;S4-2-4、将动态融合特征和静态融合特征相融合,得到总体融合特征。

全文数据:

权利要求:

百度查询: 西藏大学 一种藏医药领域实体关系联合抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。