首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于Padua量表的自然语言处理自动打表方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:昆明理工大学

摘要:本发明涉及一种基于Padua量表的自然语言处理自动打表方法,属自然语言处理和医疗信息领域。其中,包括获取ICD‑10国际诊断分类中Padua量表所对应诊断类别文本内容;将所诉诊断类别及诊断文本训练自然语言处理模型。处理医院电子病例得到结构化的既往史和病程记录中的诊断信息;使用诊断信息输入自然语言处理模型进行Padua量表的自动评估。本发明提供的基于Padua量表的自然语言处理自动打表方法能够有效的利用电子病历数据对Padua量表进行智能评估。

主权项:1.一种基于Padua量表的自然语言处理自动打表方法,其特征在于,包括如下:Step1、获取ICD-10国际诊断分类中Padua量表所对应诊断语言内容,对所诉诊断内容进行预处理,得到数据处理后的诊断类别数据;Step2、对Step1中得到的类别数据进行数据预处理,构建自然语言处理模型,使用诊断类别数据分别训练判断“既往史”的二分类模型和判断“病程记录”的五分类模型;Step3、获取医院电子病例中的既往病史和病程记录中的初步诊断以及补充诊断,对病史和诊断进行预处理;Step4、将处理好既往病史和病程记录中的诊断信息输入预构建的自然语言处理模型,得到基于病人病例的Padua量表智能评估结果;所述Step1的具体步骤如下:Step1.1.根据Padua量表表项整理ICD-10中对应诊断类别数据作为正样本类别数据;Step1.2.选取正样本中的10%把医疗情况下出现的不确定词汇随机融入到正样本中作为负样本第一部分;Step1.3.把ICD-10中与正样本明显对立的医学诊断构成负样本第二部分;Step1.4.把非正样本类别数据非负样本第一部分和非负样本第二部分的ICD-10医学诊断随机选择60%作为负样本三;所述Step2的具体步骤如下:Step2.1、对Step1中得到的数据进行数据预处理,数据预处理包括拆分训练模型数据和数据映射;数据映射包括:首先将输入序列调整到指定尺寸,将诊断字符数量小于25的补0作为填充,大于25的截取前23个字符;把医疗诊断分别都映射成文本词库的对应数字并在首尾位置分别加上[CLS]和[SEP]代表开始和结束;其次映射出诊断整体句子位置信息;最后由于第一步的映射,模型API能够读出语句字位置的映射;Step2.2.构建用于判断Padua类别的模型结构,首先将处理好的ICD-10数据作为ALbert层的输入,而后将ALbert模型作为Embedding输入到BILSTM层提取每一个字符特征,随后将第一个BILSTM层的输出输入到第二个BILSTM层,取第二个BILSTM层最后一个细胞状态Ct作为一整个诊断信息输入到最后的分类层次;Step2.3.使用判断“既往史”的二分类模型和判断“病程记录”的五分类模型分别对是否“既往静脉血栓栓塞症”和是否“活动性恶性肿瘤,患者先前有局部或远端转移和或6个月内接受过化疗和放疗”,“心脏和或呼吸衰竭”,“急性心肌梗死和或缺血性脑卒中”,“急性感染和或风湿性疾病”进行训练,二分类模型和五分类模型分别使用FocalLoss和交叉熵损失;所述Step3包括:Step3.1.使用正则表达式提取电子病例中的既往病史中的诊断信息作为既往史List;Step3.2.使用正则表达式提取病程记录中的初步诊断以及补充诊断中的诊断信息作为病程记录List;所述Step4包括把诊断文本预处理、基于既往史的诊断识别和基于病程记录初步诊断和补充诊断识别,具体步骤如下:Step4.1.把Step3中得到的既往史List和病程记录List通过步骤Step2.1中数据映射的方法进行数据预处理,从而得到处理好的既往史List和病程记录List;Step4.2.使用Step2中训练出的判断“既往史”的二分类模型和判断“病程记录”的五分类模型;Step4.3.把步骤Step4.1中得到的既往史List和病程记录List分别输入到Step4.2中的二分类模型和五分类模型对每个诊断进行逐个判别;Step4.4.把步骤Step4.3中得到的判别结果进行去重统计,最终得到Padua量表的打分结果;Step4.5.将Step4.1到Step4.4进行封装提供接口为外部提供服务。

全文数据:

权利要求:

百度查询: 昆明理工大学 一种基于Padua量表的自然语言处理自动打表方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。