买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种新药进展关系抽取方法及装置,该方法包括:获取医药相关的资讯文本序列;获取所述文本序列的BERT编码序列;抽取所述文本序列中的所有药物名称实体;依次将各药物名称实体作为条件,利用预先训练的预测模型预测得到关系三元组,所述关系三元组包括:药物名称实体、关系、关联实体。利用本发明,可以从海量资讯信息中准确、高效地得到新药进展情况。
主权项:1.一种新药进展关系抽取方法,其特征在于,所述方法包括:获取医药相关的资讯文本序列;获取所述文本序列的BERT编码序列;抽取所述文本序列中的所有药物名称实体;依次将各药物名称实体作为条件,利用预先训练的预测模型预测得到关系三元组,所述关系三元组包括:药物名称实体、关系、关联实体;其中,所述依次将各药物名称实体作为条件,利用预先训练的关系预测模型预测得到实体关系三元组包括:1依次将各药物名称实体的编码向量作为条件对所述BERT编码序列进行条件层归一化处理,得到第一测试序列;2利用所述第一测试序列及关联实体模型,预测得到各关联实体;3依次将所述药物名称实体的编码向量及各关联实体的编码向量作为条件对所述BERT编码序列进行条件层归一化处理,得到第二测试序列;4利用所述第二测试序列及关系模型,预测得到所述药物名称实体与所述关联实体的关系;5遍历完所有的药物名称实体及关联实体后,得到具有完整的药物名称实体、关系、关联实体的关系三元组;其中,当由于目标实体词比非目标实体词要少得多而引起的类别不均衡的问题,在利用模型方式进行药物名称实体抽取时,提供样本均衡调节方法,将代表类别1目标实体词的概率表示为p2,使p2更接近于0,loss还是用正常的二分类交叉熵loss,加速收敛速度。
全文数据:
权利要求:
百度查询: 药渡经纬信息科技(北京)有限公司 新药进展关系抽取方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。