中南大学陈翔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中南大学申请的专利基于预问诊文本聚类与模式识别的智能分诊方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121747878B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610233226.9,技术领域涉及:G16H40/20;该发明授权基于预问诊文本聚类与模式识别的智能分诊方法及系统是由陈翔;陈恒耀;龙军;黄文体设计研发完成,并于2026-02-27向国家知识产权局提交的专利申请。
本基于预问诊文本聚类与模式识别的智能分诊方法及系统在说明书摘要公布了:本发明公开了一种基于预问诊文本聚类与模式识别的智能分诊方法及系统,所述方法包括离线训练阶段和实时分诊阶段。离线训练阶段通过获取并预处理海量历史预问诊文本,经预训练语言模型向量化后,采用无监督聚类算法聚合语义相似向量,结合“科室‑症状”医学知识库完成聚类簇‑科室映射以生成伪标签数据集,进而训练得到智能分诊模型;实时分诊阶段对新患者主诉文本经预处理、向量化后,输入智能分诊模型输出科室预测概率并推荐最优科室。该方法无需大规模人工标注数据,大幅降低训练成本,同时提升分诊准确率与实时响应速度。
本发明授权基于预问诊文本聚类与模式识别的智能分诊方法及系统在权利要求书中公布了:1.一种基于预问诊文本聚类与模式识别的智能分诊方法,其特征在于,包括离线训练阶段和实时分诊阶段,具体步骤如下: S1、离线训练阶段: S11、预问诊文本数据获取与预处理:获取海量历史患者预问诊文本,进行数据清洗,并扩充预训练语言模型的词表; S12、文本特征向量化:采用预训练语言模型对数据清洗后的每条预问诊文本进行特征提取,输出每条文本对应的全局语义表征向量,形成特征矩阵; S13、无监督文本聚类:以所述特征矩阵为输入,通过无监督聚类算法将语义相似的全局语义表征向量聚合,输出聚类结果; S14、聚类簇-科室映射与伪标签生成:预先构建结构化“科室-症状”医学知识库;针对分类结果中每个聚类簇,提取特征关键词,计算所述特征关键词与医学知识库中各科室症状集合的匹配度,将匹配度最高的科室作为该聚类簇的映射标签,为该聚类簇内所有全局语义表征向量赋予所述映射标签,生成伪标签数据集; S15、智能分诊模型构建:以所述伪标签数据集为训练数据,训练得到基于模式识别的智能分诊模型; 实时分诊阶段: S21、实时预处理:对新患者输入的主诉文本进行清洗处理; S22、实时文本特征向量化:采用与离线训练阶段相同的预训练语言模型,将预处理后的主诉文本转换为相应的全局语义表征向量; S23、实时分诊预测:将S22得到的全局语义表征向量输入离线训练阶段构建的智能分诊模型,输出各科室的预测概率,推荐概率最高的科室。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中南大学,其通讯地址为:410083 湖南省长沙市岳麓区麓山南路932号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励