Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种用于肝癌病理文本命名的实体识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明属于自然语言处理领域,具体涉及一种用于肝癌病理文本命名的实体识别方法,该方法包括:实时获取肝癌病理文本信息,对该文本信息进行预处理;将预处理后的文本信息输入到训练好的肝癌病理文本命名实体模型,得到肝癌病理文本信息识别结果;根据识别结果对肝癌病理文本信息进行分类标记;本发明可对肝癌病理文本的十类关键实体进行精准的识别抽取,实体识别效果较好。

主权项:1.一种用于肝癌病理文本命名的实体识别方法,其特征在于,包括:实时获取肝癌病理文本信息,对该文本信息进行预处理;将预处理后的文本信息输入到训练好的肝癌病理文本命名实体模型,得到肝癌病理文本信息识别结果;根据识别结果对肝癌病理文本信息进行分类标记;肝癌病理文本命名实体模型包括:NER教师模型、十折模型以及命名实体抽取模型;对肝癌病理文本命名实体模型进行训练的过程包括:S1:获取肝癌病理文本数据集,将该数据集输入到肝癌体系化标注知识库中,对肝癌病理文本数据集中的数据进行实体标注;S2:将肝癌病理文本数据集输入到NER教师模型中,采用半监督-自训练方式得到训练集的标签softlabel,具体包括:将具有原始标注数据的病理文本输入到BERT_CRF模型中进行训练验证,选取验证集上f1值最高的一个模型作为NER教师模型;采用NER教师模型对未标注肝癌病理文本数据进行预测,预测结果为soft标签;将得到soft标签的数据作为增强数据,将增强数据病理文本与原始标注数据的病理文本进行合并,得到训练集的标签softlabel;S3:将进行实体标注的肝癌病理文本数据集输入到十折模型进行训练,得到增强去噪后的实体标注肝癌病理文本数据集;将增强后的实体标注肝癌病理文本数据集与训练集的标签softlabel进行合并,得到训练数据集;S4:将训练集中的数据输入到命名实体抽取模型中进行训练,得到识别结果;其中采用BERT+CRF框架构建命名实体抽取模型;S5:根据识别结果计算模型的损失函数,采用AdamW优化器、基于余弦退火的学习率调整算法以及快照集成学习对模型的参数进行调整,当损失函数的值达到最小时,完成模型的训练。

全文数据:

权利要求:

百度查询: 重庆邮电大学 一种用于肝癌病理文本命名的实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。