基于预训练的疾病术语归一化方法、系统、设备及介质

导航：龙图腾网> 最新专利技术> 基于预训练的疾病术语归一化方法、系统、设备及介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中山大学

摘要：本申请公开了一种基于预训练的疾病术语归一化方法、系统、设备及介质，将采集的70万余条待归一化文本，以及对应的归一化后的标准术语拼接组合为第一训练样本数据，采用第一训练样本数据对构建完成的生成模型和多标签分类模型进行训练，采用训练完成的生成模型和多标签分类模型召回第一和第二候补样本，以及基于ICD‑10的层次关系和第一训练样本数据的相似样本召回第三和第四候补样本，以提高术语召回覆盖率和准确率，通过收集大规模疾病术语作为训练样本，提高生成模型和多标签分类模型在小样本术语上的性能，进一步的，基于对比思想，采用第一训练样本数据和对应的候补负样本训练文本匹配模型，提高文本匹配模型相似术语区分的能力。

主权项：1.一种基于预训练的疾病术语归一化方法，其特征在于，所述方法包括：获取待归一化文本和对应的归一化后的标准术语，将所述待归一化文本和对应的归一化后的标准术语拼接为文本对，以构建第一训练样本数据；采用所述第一训练样本数据集对构建完成的生成模型和多标签分类模型进行训练；将所述待归一化文本分别输入训练完成的生成模型和多标签分类模型，分别召回第一候补样本和第二候补样本，并剔除所述第一候补样本和所述第二候补样本中存在的所述标准术语，得到候补负样本；基于对比思想，采用所述第一训练样本数据和对应的候补负样本训练构建完成的文本匹配模型；针对用户输入的待归一化文本，使用训练完成的所述生成模型和所述多标签分类模型，得到候补术语以组成候补术语集，并将所述用户输入的待归一化文本和所述候补术语集拼接后输入训练完成的文本匹配模型，输出术语归一化结果。

全文数据：

权利要求：

百度查询：中山大学基于预训练的疾病术语归一化方法、系统、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：单电池气密流阻测试工装结构

下一篇：写请求的处理方法、装置、设备和介质

相关技术

单电池气密流阻测试工装结构

写请求的处理方法、装置、设备和介质

一种基于Wollaston棱镜的同步移相干涉装置及方法

一种家具耐用性综合测试平台及其测试方法

一种高效的柔性钙钛矿太阳能电池封装方法

一种可移动式预装变电站

一种基于三嗪共价有机框架材料的制备及用途

一种高速机械磨削主轴加工装置

一种高直流叠加特性低损耗复合磁粉心的制备方法

一株马立克病病毒双基因编辑缺失疫苗株SD01ΔmeqΔM11及构建和应用

一种接地线缆开关状态检测装置和检测方法

一种超声波诊断检查防护装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于预训练的疾病术语归一化方法、系统、设备及介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务