首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种ICU电子病历知识图谱构建方法、系统和存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东软教育科技集团有限公司

摘要:本发明公开了一种ICU电子病历知识图谱构建方法、系统及存储介质,包括:创建ICU患者特征数据集;通过预处理后的ICU患者特征数据集和关联规则挖掘算法分别进行事实和推理的知识抽取,并采用三元组形式表示知识;根据特征数据集反映的已有事实,构建基于事实的知识图谱,并在此基础上,将多对多实体之间的推理知识映射到图结构中,完成基于事实和推理的ICU电子病历知识图谱构建;利用基于事实和推理的图嵌入方法,生成每个患者特征映射的低维稠密向量;计算各个患者低维稠密向量之间的相似度矩阵,根据相似度排序返回给定患者的Topk个相似电子病历。本发明采用基于事实和推理的方式构建ICU电子病历知识图谱,增加了ICU电子病历知识图谱的完备性。

主权项:1.一种ICU电子病历知识图谱构建方法,其特征在于,所述方法包括:创建ICU患者特征数据集;对所述ICU患者特征数据集中的数据预处理;通过预处理后的ICU患者特征数据集和关联规则挖掘算法分别进行事实和推理的知识抽取,并采用三元组形式表示知识;根据所述ICU患者特征数据集反映的已有事实,构建基于事实的知识图谱,并在所述基于事实的知识图谱的基础上,将多对多实体之间的推理知识映射到图结构中,完成基于事实和推理的ICU电子病历知识图谱构建过程;利用基于事实和推理的图嵌入方法,生成每个患者特征映射的低维稠密向量;计算各个患者低维稠密向量之间的相似度矩阵,根据相似度排序返回给定患者排名靠前的k个相似电子病历,k为正整数;其中,基于事实和推理的ICU电子病历知识图谱构建包括:基于所述ICU患者特征集中记录的患者信息所反映的已有事实进行知识抽取,得到基于事实的知识图谱,包括:根据所述ICU患者特征集中记录的患者信息所反映的已有事实,构造基于事实的图结构Gfacts=V,E,w;其中,V、E分别表示图构成顶点和边的集合,w表示边的权重,顶点node1与顶点node2之间边的权重wnode1,node2表示由顶点node1游走到node2的概率;当node1→node2是基于事实的描述时,其边的权重wnode1,node2=1,即顶点node1游走到node2的概率;所述ICU患者特征集中记录的患者信息为已有事实;基于所述ICU患者特征集中记录的患者信息所反映的已有事实,构建事务数据库,每个患者的特征集合表示一个事务;基于所述事务数据库,利用关联规则挖掘算法生成用于反映所述事务间关联关系的多条关联规则,实现基于推理进行知识抽取过程;引入第i条关联规则Rulei,i从1开始,并构造LHSi和RHSi的虚拟顶点,分别记作Li'和Ri';所述第i条关联规则Rulei为: 其中,LHSi和RHSi分别表示Rulei的先导和后继,LHSi包含元素的集合记作RHSi包含元素的集合记作confi表示Rulei的置信度,取值范围为[0,1];遍历所有符合条件的顶点P,当Gfacts中存在顶点P的邻接顶点同时包含LHSi中所有元素时,新增顶点P指向虚拟顶点Li'的有向边,边的权重为wP,Li'=1;新增虚拟顶点Li'指向虚拟顶点Ri'的有向边,边的权重为Rulei的置信度,即wLi',Ri'=confi;当前图构成顶点、边与权重的集合分别用V'、E'、w'表示,更新图结构G'=V',E',w';当所有符合条件的顶点P遍历结束时,更新i=i+1,按照上述引入第i条关联规则Rulei的方式,遍历下一条关联规则;当所有关联规则遍历结束时,算法终止,返回基于关联规则的图结构Grules=G'=V',E',w';其中,所述基于事实和推理的图嵌入方法包括:根据传统随机游走算法生成初始路径序列paths=[path1,path2,...,pathP],P表示所有子路径的数量;根据图结构Grules中顶点nodev与顶点包含元素列表element_listv构成的键值对dictv={nodev:element_listv},v=1,2,...,|V|,V表示Grules中顶点数量;通过键值对dictv映射关系,找到子路径p中每个节点v'的键值对dictpv'={nodepv':element_listpv'},p=1,2,...,|P,v'=1,2,...,|N|,N表示子路径pathp的长度;计算子路径p中每个节点v'的元素列表长度len_elmpv'=lenelement_listpv',p=1,2,...,|P|,v'=1,2,...,|N|;针对子路径p中的各个节点v',当len_elmpv'≤1时,表示节点v'只包含自身一个元素,则将nodepv'直接插入新子路径path_newp中;当len_elmpv'1时,表示节点v'包含多个元素,则先将element_listpv'进行乱序排列,每种乱序结果生成的概率为1len_elmpv'!,再将乱序后结果插入到path_newp中;直到子路径p中的所有节点都加入到新子路径path_newp;将新子路径path_newp加入到新路径序列paths_new中;直到所有新子路径都加入到新路径序列中,即paths_new=[path_new1,path_new2,...,path_newP];输出基于事实和推理的新随机游走路径序列paths_new,算法结束。

全文数据:

权利要求:

百度查询: 东软教育科技集团有限公司 一种ICU电子病历知识图谱构建方法、系统和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。