西安电子科技大学李卫斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安电子科技大学申请的专利一种应用于水利领域的多模态大模型构建方法、系统、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119721233B 。
龙图腾网通过国家知识产权局官网在2026-01-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411358506.X,技术领域涉及:G06N5/04;该发明授权一种应用于水利领域的多模态大模型构建方法、系统、设备和介质是由李卫斌;任意;胡彦华;董旭荣设计研发完成,并于2024-09-27向国家知识产权局提交的专利申请。
本一种应用于水利领域的多模态大模型构建方法、系统、设备和介质在说明书摘要公布了:一种应用于水利领域的多模态大模型构建方法、系统、设备和介质,先获取水利领域文本数据并进行预处理,并结合向量数据库构建本地知识库,再对预处理后的水利领域文本数据设计提示词,调用大语言模型及人工标注生成问答形式数据集;对本地大语言模型词表扩充,并基于预处理后的水利领域文本数据,对词表扩充后的本地大语言模型二次预训练,得到水利领域大模型;接着基于问答形式数据集,使用Lora算法对水利领域大模型进行指令精调,生成水利领域智能聊天大模型;构建评测数据集评测水利领域智能聊天大模型的性能;基于水利领域智能聊天大模型和本地知识库,构建专用于水利领域的Water_Agent,并基于评测数据集,评测和优化;本发明具有准确性、效率高等优点。
本发明授权一种应用于水利领域的多模态大模型构建方法、系统、设备和介质在权利要求书中公布了:1.一种应用于水利领域的多模态大模型构建方法,其特征在于,包括以下步骤: 步骤1,获取水利领域文本数据Wraw; 步骤2,对步骤1获取的水利领域文本数据Wraw进行预处理,得到预处理后的水利领域文本数据Wpreprocess; 所述步骤2预处理包括数据清洗和数据分类; 步骤2.1,数据清洗:对步骤1获取的水利领域文本数据Wraw进行删除重复字符,过滤杂乱字符; 步骤2.2,数据分类为:将步骤2.1数据清洗后的水利领域文本数据Wraw划分为多个水利子领域;所述的水利子领域包括但不限于水库与水利知识,水利安全,水力水电,水法,水资源与项目管理,地方水利,城乡供水与排水,工程力学、岩土力学、工程结构及材料,水利史,水利工程勘测,水利工程施工,水利科研、教育、信息出版、学术团体,水利管理,水利经济,水利规划,水力发电,水力学、河流及海岸动力学,水土保持,水工建筑物,水文与水资源,灌溉与排水; 步骤3,基于向量数据库Chroma和步骤2预处理后的水利领域文本数据Wpreprocess,构建专用于水利领域的本地知识库D; 步骤4,对步骤2预处理后的水利领域文本数据Wpreprocess设计不同的提示词,调用大语言模型api及人工标注的方式生成专用水利领域的不同格式的问答形式数据集Qpreprocess,包括知识型数据集、任务型数据集、多轮问答及负样本数据集; 步骤5,对本地大语言模型Chatglm3或本地大语言模型qwen进行词表扩充,并基于步骤2预处理后的水利领域文本数据Wpreproccess,对词表扩充后的本地大语言模型Chatglm3或本地大语言模型qwen进行二次预训练,得到具有大量水利领域知识的水利领域大模型waterGPT_base; 步骤6,基于步骤4生成的问答形式数据集Qpreproccess,使用Lora算法对步骤5得到的水利领域大模型waterGPT_base进行指令精调,生成水利领域智能聊天大模型waterGPT; 步骤7,通过步骤2中预处理后的水利领域文本数据Wpreproccess,设计不同的提示词,采用大模型生成和人工标注的方式生成若干选择题,构建评测数据集EvalWater,同时在评测数据集EvalWater上评测水利领域智能聊天大模型WaterGPT的性能; 所述步骤7中的评测数据集EvalWater包括水库与水利知识,水利安全,水力水电,水法,水资源与项目管理,地方水利,城乡供水与排水,工程力学、岩土力学、工程结构及材料,水利史,水利工程勘测,水利工程施工,水利科研、教育、信息出版、学术团体,水利管理,水利经济,水利规划,水力发电,水力学、河流及海岸动力学,水土保持,水工建筑物,水文与水资源,灌溉与排水; 步骤8,基于步骤6得到的水利领域智能聊天大模型waterGPT和步骤3构建的本地知识库D,通过提示工程构建专用于水利领域的Water_Agent,用于智能调用各种工具,以完成各项水利任务; 4.1在多智能体框架中,水利工作者代理们通过模拟沟通与讨论的过程来确定任务种类及任务解决方案; 4.2若判断已有工具无法解决问题,则会采用编程来解决问题的思路,水利工作者代理将详细任务描述及讨论结果提交给程序员代理; 4.3程序员代理在反思、思考与推理后生成初步代码,并将代码递交给检错员代理; 4.4检错员代理执行代码并收集终端反馈信息,经过深思熟虑后提出代码优化建议并反馈给程序员代理; 4.5程序员代理根据检错员代理的建议对代码进行修正,经过多轮迭代直至双方共识代码无误; 4.6最终,将审定无误的代码、任务详情及执行结果汇报给执行大脑代理; 4.7执行大脑代理对代码进行封装,封装成工具,就结果进行深入分析,并编撰成系统的执行报告,完成整个任务的执行与反馈过程; 步骤9,基于步骤7得到的评测数据集EvalWater,对步骤8构建的专用于水利领域的Water_Agent进行效果评测和优化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市雁塔区太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励