买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华东理工大学
摘要:本发明公开了一种基于大模型的多阶段电子病历出院小结生成方法。获取各个专科医疗电子病历,预处理后得到专科结构化文档,并将其分为训练集和测试集;将训练集中的专科结构化文档中的各个字段内容,实现基于聚类的文本语义分割;构建语义分割ICL示例,根据类别标签列表和训练集中的专科电子病历文本输入到大语言模型进行推理,得到经过了语义分割的电子病历文本;建立文书名以及文书名下的字段名的一对一、一对多的映射关系,根据不同情况构建对应的专科电子病历溯源模板;设计多种子病历出院小结生成指令模板;最后,选择训练语料库中相似的样本作为ICL示例,通过大模型生成电子病历出院小结。本发明提高了长文本的出院小结的自动生成的质量。
主权项:1.一种基于大模型的多阶段电子病历出院小结生成方法,其特征在于,包括以下步骤:S1、获取各个专科医疗电子病历,进行病历数据预处理,对各个专科医疗电子病历中的长文本通过规则进行初步整理,包括根据字段映射提取、脱敏,然后将每位患者的多个文书整理成一个专科结构化文档,专科结构化文档是一个结构化json文档,json文档包括多个文书名、每个文书包括的字段名和字段内容;并将专科结构化文档分割成训练集和测试集;S2、对训练集中的专科结构化文档中的各个字段内容,实现基于聚类的文本语义分割,所述的文本语义分割是将某字段的文本按句子进行分割,形成基于语义的不同句子簇,对聚类结果的每一簇进行清洗和整理,最后由医生验证和标注句子簇内容对应的医学名称,将医学名称作为最终的类名,汇总所有的类名形成一个类别标签列表;S3、对训练集中的专科结构化文档中的任一字段内容,构建语义分割ICL示例,根据所述的类别标签列表和训练集中的专科电子病历文本输入到大语言模型进行推理,得到经过了语义分割的电子病历文本,再对语义分割的电子病历文本按照每个类名进行整理,每个类名下包括所有该字段内容中所有属于该类的语句,对各个字段形成其多个子类名,每个子类名下包含字段内容中属于该子类的所有句子;S4、按照专科检索电子病历出院小结中各个字段的电子病历来源,锁定该字段下每个子类名对应的来源文书名以及文书名下的字段名,建立一对一、一对多的映射关系,根据不同情况构建对应的专科电子病历溯源模板,其中,一对多的映射关系内包含检索词,专科电子病历溯源模板包括:字段名,子类名,类来源文书名,类来源字段名,检索词;S5、设计多种子病历出院小结生成指令模板,对训练集中所有样本进行处理,按照专科电子病历溯源模板构建模型输入、模型输出,形成训练语料库,指令模板包括:指令集、模型输入、模型输出三部分;S6、根据专科电子病历溯源模板中的情况划分,判断输入样本中是否存在各字段的子类名,选择训练语料库中相似的样本作为ICL示例,以帮助模型进行电子病历出院小结各字段的训练或生成摘要,并将不同字段的摘要汇总作为自动生成的电子病历出院小结。
全文数据:
权利要求:
百度查询: 华东理工大学 一种基于大模型的多阶段电子病历出院小结生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。