首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于微调大模型的智能导诊方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:厦门狄耐克物联智慧科技有限公司

摘要:本发明公开了一种基于微调大模型的智能导诊方法,包括以下步骤:S1:首选采用Scrapy和OpenRefine方法对专业医疗期刊、医疗专业书籍、临床路径规范、互联网问诊数据和电子病历数据进行数据获取与数据清洗。本发明通过利用大量的医疗数据做训练,能够提升导诊覆盖的疾病种类,可以大量减少专业医生建立知识图谱的工作量,且患者可以用自然语言、人机交流的方式实现导诊,且通过对微调大模型进行改进可以提高导诊的准确性,特别是同一种症状表现多种疾病的情况下能更准确的判断患者的就诊科室。

主权项:1.一种基于微调大模型的智能导诊方法,其特征在于,包括以下步骤:S1:采用Scrapy和OpenRefine方法对专业医疗期刊、医疗专业书籍、临床路径规范、互联网问诊数据和电子病历数据进行数据获取与数据清洗;S2:采用OpenRefine方法对S1中获取数据中病症的症状表现进行去重,先对同一症状表现不同的口语表达进行标注处理,且对标注的数据增加专业医学术语标签,通过识别不同的症状表现,但是相同标签的识别为重复项,做去重处理;S3:采用Transformer作为预训练模型,Transformer作为自然语言处理模型,采用大量真实患者的导诊语料结合S2中所述的病症标注数据进行训练;S4:根据导诊场景的业务特点采用7B模型作为模型的参数量,并设计模型的具体结构,确保模型的准确率的同时降低模型训练的硬件资源要求;S5:将S3中预训练后的模型数据划分为多个子集,并结合S4中所述的模型结构和参数量,进行多卡并行训练;S6:使用独立的测试集评估S5中训练后的模型的性能,通过模型整体的准确率评估函数TPX和精确率函数APX两个维度对模型进行评估,选取20%样本数据作为评估样本,通过两个函数计算模型的整体的问诊表现以及针对各个疾病问诊的精确性进行评估;S7:邀请专业医生与专家对问诊模型进行回答,并进行数据标注,对模型的每个回答正确性分为3个标准,分别是正相关、不相关、负相关;针对整个问诊过程给予两个标注,完整、不完整;比分权重每个症状回答正相关为3分,不相关1分,负相关-1分;问诊过程完整性3分,不完整0分;选取完整性评分为3的问诊数据,再选取不包含负相关的标注数据,根据S6中所述的评估结果采用批量微调BatchFine-tuning微调方法对选取的数据进行微调,改进问诊模型的性能;S8:患者输入或者使用自然语言与S7中改进问诊模型后的智能导诊交流时,问诊模型对患者交流的信息进行识别,并给患者提出就诊建议。

全文数据:

权利要求:

百度查询: 厦门狄耐克物联智慧科技有限公司 一种基于微调大模型的智能导诊方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。