买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东工业大学
摘要:本发明提出一种基于知识图谱和自适应机制的疾病推理系统,涉及计算机技术、辅助医疗机械的技术领域,以三元组症状,发生部位,疾病的知识图谱为数据结构,以TransE翻译模型和朴素贝叶斯分类器为基础构建疾病推理模型,首先将数据集划分的,为每一部分的数据集寻找合适个数的TransE翻译模型和朴素贝叶斯分类器搭配,实现自适应匹配,既能减少输入不平衡性对模型的影响,还能利用朴素贝叶斯分类器提升可解释性,提高系统对疾病推理的准确率,进一步辅助提高医疗工作人员的工作效率。
主权项:1.一种基于知识图谱和自适应机制的疾病推理系统,其特征在于,所述系统包括:数据获取模块,用于构建以三元组症状,发生部位,疾病为结构的知识图谱,确定由若干个三元组症状,发生部位,疾病组成的训练数据集;确定症状,发生部位组成的测试数据集;疾病推理模型构建模块,基于TransE翻译模型和朴素贝叶斯分类器,构建疾病推理模型;数据分割模块,用于将训练数据集划分,将测试数据集划分;疾病推理模型训练模块,利用训练数据集训练疾病推理模型,确定训练数据集划分下,疾病推理模型中TransE翻译模型的个数n、朴素贝叶斯分类器的个数m及边界值M;测试模块,以划分下的测试数据集症状,发生部位作为输入数据组,将输入数据组的数目与边界值M进行比较,输入至具有不同TransE翻译模型个数及朴素贝叶斯分类器个数的疾病推理模型中,输出疾病预测值;数据获取模块构建以三元组症状,发生部位,疾病为结构的知识图谱的过程为:获取知识图谱所需医学字段,对医学字段进行分词操作,将“疾病”、“发生部位”、“症状”信息与除三者之外的无用信息进行分离;对分离后的“疾病”、“发生部位”、“症状”信息做关键词提取,得到以三元组症状,发生部位,疾病为结构的知识图谱;所述由若干个三元组症状,发生部位,疾病组成的训练数据集为若干个“疾病”病种分别对应下的症状,发生部位数据组成的三元组症状,发生部位,疾病集合;所述测试数据集为症状,发生部位数据组成的集合;三元组症状,发生部位,疾病中的“症状”和“疾病”分别为头部实体和尾部实体,“发生部位”为关系,疾病推理模型构建模块基于TransE翻译模型将知识图谱中的三元组实体和关系均表示为同一空间中的向量,并将关系看作实体间的平移向量;设头部“症状”实体表示为头向量h,“发生部位”关系表示成为向量r,尾部“疾病”实体表示为尾向量t,L类疾病分别为{b1,b2,…,bL},bj表示第j类疾病;设存在K组症状,发生部位数据待推理疾病,疾病推理模型构建模块基于TransE翻译模型和朴素贝叶斯分类器,构建的疾病推理模型为: 其中,疾病推理模型由n个TransE翻译模型的距离值和m个朴素贝叶斯分类器的概率值组成,表示TransE翻译模型在K组症状,发生部位数据输入时的距离值,通过累乘得到TransE翻译模型的最终距离值Dbj: 其中,L1为曼哈顿距离,L2为欧氏距离;表示朴素贝叶斯分类器在K组症状,发生部位数据输入时的距离值,通过累乘获得朴素贝叶斯分类器的最大概率值dmax,表示为: 其中,Ptbj指先验概率,是指一种“症状”特征在未进入朴素贝叶斯分类器前,这种症状属于疾病bj的概率;dmax为朴素贝叶斯分类器的最大概率值,在求取后添加负号,与n个TransE翻译模型的距离值相乘之后求取最小值,得到疾病推理模型,F表示疾病推理模型的预测结果。
全文数据:
权利要求:
百度查询: 广东工业大学 一种基于知识图谱和自适应机制的辅助疾病推理系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。