恭喜西安快鱼科技有限公司陈华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜西安快鱼科技有限公司申请的专利基于多模态大模型的关键信息提取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118969258B 。
龙图腾网通过国家知识产权局官网在2025-04-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411421967.7,技术领域涉及:G16H50/20;该发明授权基于多模态大模型的关键信息提取方法及系统是由陈华;关淋童;李艳设计研发完成,并于2024-10-12向国家知识产权局提交的专利申请。
本基于多模态大模型的关键信息提取方法及系统在说明书摘要公布了:本发明涉及多模态大模型技术领域,一种基于多模态大模型的关键信息提取方法及系统,包括:根据迭代训练数据对初始多模态大模型进行训练,对迭代多模态大模型进行预测误差验证,得到最大预测误差,判断最大预测误差是否小于预测误差阈值,若不小于,则更新训练后备数据、初始多模态大模型及初始采样比例,并返回训练,若小于,则将迭代多模态大模型作为目标多模态大模型,根据多模态医疗当前数据,利用目标多模态大模型进行病名预测,根据预测病名在多模态医疗当前数据中提取关键信息。本发明可解决当前多模态大模型的训练过程存在训练效率低、训练效果差的问题。
本发明授权基于多模态大模型的关键信息提取方法及系统在权利要求书中公布了:1.一种基于多模态大模型的关键信息提取方法,其特征在于,所述方法包括:获取多模态医疗训练数据,其中,所述多模态医疗训练数据包括:医疗文本训练数据、医疗影像训练数据、医疗发声训练数据及确诊病名训练数据;根据预设的单位验证数据量在多模态医疗训练数据中提取预测验证数据,得到训练后备数据,获取初始多模态大模型,其中,所述初始多模态大模型基于BP神经网络构建;根据预设的单位训练数据量及初始采样比例在所述训练后备数据中提取迭代训练数据,得到迭代后备数据;利用所述迭代训练数据对所述初始多模态大模型进行训练,得到迭代多模态大模型;利用所述预测验证数据对所述迭代多模态大模型进行预测误差验证,得到预测误差比例及最大预测误差;判断所述最大预测误差是否小于预设的预测误差阈值;若所述最大预测误差不小于预测误差阈值,则分别利用所述迭代后备数据、迭代多模态大模型及预测误差比例更新所述训练后备数据、初始多模态大模型及初始采样比例,并返回上述根据预设的单位训练数据量及初始采样比例在所述训练后备数据中提取迭代训练数据的步骤;若所述最大预测误差小于预测误差阈值,则将所述迭代多模态大模型作为目标多模态大模型;接收多模态医疗当前数据,根据所述多模态医疗当前数据,利用所述目标多模态大模型进行病名预测,得到预测病名;根据所述预测病名在所述多模态医疗当前数据中提取关键信息;所述根据预设的单位验证数据量在多模态医疗训练数据中提取预测验证数据,得到训练后备数据,包括:在所述多模态医疗训练数据中依次随机提取多模态医疗病例数据;对所述多模态医疗病例数据进行病例统计,得到随机病例数;判断所述随机病例数是否小于所述单位验证数据量;若所述随机病例数小于所述单位验证数据量,则返回上述在所述多模态医疗训练数据中依次随机提取多模态医疗病例数据的步骤;若所述随机病例数不小于所述单位验证数据量,则汇总所有多模态医疗病例数据,得到初始验证数据;识别所述初始验证数据的初始验证病名集,判断所述初始验证病名集是否是预设的确诊病名集的真子集;若所述初始验证病名集是所述确诊病名集的真子集,则返回上述在所述多模态医疗训练数据中依次随机提取多模态医疗病例数据的步骤;若所述初始验证病名集不是所述确诊病名集的真子集,则将所述初始验证数据作为预测验证数据;将所述预测验证数据从所述多模态医疗训练数据中剔除,得到训练后备数据;所述根据预设的单位训练数据量及初始采样比例在所述训练后备数据中提取迭代训练数据,得到迭代后备数据,包括:根据所述单位训练数据量及初始采样比例,利用如下公式计算文本医疗数据病例数、影像医疗数据病例数及发声医疗数据病例数: ;其中,表示第i个医疗数据病例数,表示文本医疗数据病例数,表示影像医疗数据病例数,表示发声医疗数据病例数,表示单位训练数据量,表示初始采样比例中第i个采样比例系数;根据所述文本医疗数据病例数、影像医疗数据病例数及发声医疗数据病例数分别在所述训练后备数据中提取文本医疗病例数据、影像医疗病例数据及发声医疗病例数据,得到迭代训练数据;将所述迭代训练数据从所述训练后备数据中剔除,得到迭代后备数据;所述利用所述预测验证数据对所述迭代多模态大模型进行预测误差验证,得到预测误差比例及最大预测误差,包括:对所述预测验证数据进行数据分类,得到文本验证病例数据、影像验证病例数据及发声验证病例数据;将所述文本验证病例数据、影像验证病例数据及发声验证病例数据分别转换为文本验证向量、影像验证向量及发声验证向量;分别在所述文本验证向量、影像验证向量及发声验证向量中依次提取单例文本验证向量、单例影像验证向量及单例发声验证向量;将所述单例文本验证向量、单例影像验证向量及单例发声验证向量分别输入至迭代多模态大模型中,得到迭代验证数值;判断所述文本验证向量、影像验证向量及发声验证向量是否完成单例文本验证向量、单例影像验证向量及单例发声验证向量的提取;若所述文本验证向量、影像验证向量及发声验证向量未完成单例文本验证向量、单例影像验证向量及单例发声验证向量的提取,则返回上述分别在所述文本验证向量、影像验证向量及发声验证向量中依次提取单例文本验证向量、单例影像验证向量及单例发声验证向量的步骤;若所述文本验证向量、影像验证向量及发声验证向量完成单例文本验证向量、单例影像验证向量及单例发声验证向量的提取,则汇总迭代验证数值,得到迭代验证数值集;根据所述确诊病名集对所述迭代验证数值集进行分类,得到多组验证预测数值集;在所述多组验证预测数值集中依次提取验证预测数值集,识别所述验证预测数值集对应的目标病名值域的目标中心值;计算所述验证预测数值集与所述目标中心值的病名预测误差集,根据所述病名预测误差集计算病名预测误差均值,得到病名预测误差均值集;对所述病名预测误差均值集进行比例约算,得到预测误差比例,在所述病名预测误差均值集中提取最大病名预测误差均值,将所述最大病名预测误差均值作为最大预测误差。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安快鱼科技有限公司,其通讯地址为:710076 陕西省西安市高新区天谷六路789号大华股份西安数智产业园7号楼701室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。