买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东众阳健康科技集团有限公司
摘要:一种基于深度学习的ICD手术与操作编码自动匹配方法,使用了模块化建模的方法,每个模块只完成相对简单的一项任务,大大减小了模型参数的搜寻空间,缩减了所需要的数据量。本方法采用了双向自回归语言模型对自然语言序列进行建模,使用每一条手术描述和每一条ICD编码结合,计算出他们之间的语义空间权重,并使用语义空间权重对手术描述进行重构,最后使用重构之后的手术描述进行ICD编码分类匹配以解决概念拆分的问题,在计算中也使用了ICD手术与操作编码固有的的层级结构进行双向自回归模型建模,融入了业务先验知识。解决了临床中遇到的问题,可以快速、准确地进行ICD编码匹配。
主权项:1.一种基于深度学习的ICD手术与操作编码自动匹配方法,其特征在于,包括如下步骤:a利用医学文本语料进行字向量的预训练,字向量矩阵为Δ,其中N为字典中字的个数,d为字向量的维度,为实数空间,Δ∈{δ1,δ2,...,δn},δi为单个字的字向量,i为单个字的字向量的编号,1≤i≤n,通过公式计算得到最大值的字向量矩阵其中P为概率,ci为自然语言序列中的一个字,为ci的上下文,T为矩阵转置,W为上下文取的窗口范围的字数,为在W范围内字向量的编号,1≤n≤N,n为正整数;b获取医生在电子病历中录入的手术描述,通过索引步骤a中最大值的字向量矩阵将电子病历中医生录入的手术描述中的每一个字用字向量hopt表示,其中len为电子病历中医生录入的手术描述的字数,为自然语言序列中的第j个字,j∈{1,2,...,len};c将hopt进行双向自回归神经网络建模,正向建模顺序为从j=1到j=len,反向建模顺序是从j=len到j=1,建模完成后输出的正向隐状态序列为输出的反向隐状态序列为将正向隐状态序列和反向隐状态序列在d的维度上进行矩阵级联,矩阵级联后进行线性映射,获得为通过双休自回归神经网络建模后的电子病历中的手术描述,linear为线性映射;d获取国际疾病分类手术与操作编码中对于每一个标准手术编码的编码描述,通过索引步骤a中最大值的字向量矩阵将国际疾病分类手术与操作编码的字向量表示为hcode;e将hcode进行双向自回归神经网络建模,正向建模顺序为从j=1到j=len,反向建模顺序是从j=len到j=1,建模完成后输出的正向隐状态序列为输出的反向隐状态序列为将正向隐状态序列和反向隐状态序列在d的维度上进行矩阵级联,矩阵级联后进行线性映射,获得为通过双休自回归神经网络建模后的标准手术编码的编码描述,clen为编码描述的字数;f将编码描述进行树形自回归神经网络建模得到g通过公式计算中每个字对于的语义空间权重,为电子病历中手术描述中第i个字对应的隐状态,为某个ICD手术编码所对应的编码描述,1≤l≤len,l为正整数,通过公式计算使用语义空间权重αi对进行重构,得到重构后的重构后的为m,通过公式p=σLinearm对m进行线性映射,线性映射后用sigmoid概率映射函数激活,式中p为介于0到1之间的实数,Z为ICD手术与操作编码的个数;h里通过公式Loss=-glogp-1-glog1-p计算模型的损失Loss,式中g为标记的正确结果,使用梯度下降法使损失最小化。
全文数据:
权利要求:
百度查询: 山东众阳健康科技集团有限公司 一种基于深度学习的ICD手术与操作编码自动匹配方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。