买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨理工大学;哈尔滨工业大学;中数(深圳)时代科技有限公司
摘要:本发明一种基于联邦学习和知识图谱的痛风病分期预测方法、系统及存储介质,涉及智能医疗领域,为解决现有的机器学习模型难以全面、准确地捕捉病例数据中的关键信息,且存在隐私数据泄露的风险,及医院之间的数据孤岛问题。本发明客户端基于患者病历数据集构建关键词相关的知识图谱子图;中心服务端构建有R‑GCN模型,客户端采用知识图谱子图对R‑GCN模型进行训练,模型参数经加密后发送至中心服务端聚合,至模型满足训练条件。采用训练后的模型对知识图谱子图进行编码,得到编码信息R1;对数据集中的文本特征数据进行向量化编码与数值特征进行横向连接得到编码信息R2;横向连接编码信息R1与R2后,经过深度学习网络模型对痛风病的不同分期进行分类预测。
主权项:1.一种基于联邦学习和知识图谱的痛风病分期预测方法,其特征在于,所述方法基于联邦学习模型,所述联邦学习模型包括一个中心服务端和N个客户端,包括如下步骤:S1、客户端从医院获取患者病历,经过数据预处理得到医疗数据集S,基于数据集S进行特征提取,得到特征数据集F1,依据不同的特征类型将特征数据集F1分为数值特征数据集F2和文本特征数据集F3;S2、基于数据集S构建图结构,形成知识图谱G;构建病例特征数据中的关键词组,在知识图谱中查询关键词的实体,得到关键词相关的知识图谱子图G1,G2...Gn;S3、所述中心服务端构建有R-GCN模型,并对模型进行初始化;S4、所述中心服务端将模型下发至各客户端,各客户端基于知识图谱子图对R-GCN模型进行训练,训练后为模型参数数据添加噪声进行加密,并对数据进行压缩,将模型参数上传至中心服务端;S5、中心服务端对各客户端的模型参数数据进行去噪声处理,然后对数据进行聚合,更新模型参数,得到全局模型;S6、中心服务端对全局模型的效果进行验证,若结果不满足条件则重复执行S4-S5的操作,至结果满足条件终止训练;S7、采用训练后的R-GCN模型对知识图谱子图进行编码,得到编码信息R1;S8、基于改进的MC-BERT模型对F3中的文本特征数据进行向量化编码,编码信息与归一化的F2中的数值特征数据进行横向连接得到编码信息R2;所述改进的MC-BERT模型在编码层采用多个遮蔽层对词组和专业医学文本进行遮蔽,同时在输入层引入KeywordsEmbedding层,以获取到融合关键词信息的文本表示;S9、横向连接编码信息R1与编码信息R2后,经过深度学习网络模型对痛风病的不同分期进行分类预测。
全文数据:
权利要求:
百度查询: 哈尔滨理工大学 哈尔滨工业大学 中数(深圳)时代科技有限公司 一种基于联邦学习和知识图谱的痛风病分期预测方法、系统及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。