恭喜郑州大学杨海波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜郑州大学申请的专利一种基于微调ChatGLM2的滑坡知识图谱智能生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119357404B 。
龙图腾网通过国家知识产权局官网在2025-04-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411377327.0,技术领域涉及:G06F16/36;该发明授权一种基于微调ChatGLM2的滑坡知识图谱智能生成方法是由杨海波;吴峥嵘;盛朋飞;梁创恒;余波;徐鹏;晋磊;蔡迎春设计研发完成,并于2024-09-30向国家知识产权局提交的专利申请。
本一种基于微调ChatGLM2的滑坡知识图谱智能生成方法在说明书摘要公布了:本发明公开了一种基于微调ChatGLM2的滑坡知识图谱智能生成方法,属于知识图谱技术领域,包括:将收集的第一数据信息处理成文本格式;对第一数据信息进行初步清洗,划分为多条语句信息,基于正则表达式对语句信息进行深度清洗获得第二数据信息;将第二数据信息输入ChatGLM2130B,基于构建的问答模板对第二数据信息进行三元组粗划分和人工校对,获得三元组数据集;基于模型微调技术对ChatGLM26B的参数进行训练并加载至大语言模型中,输入三元组数据集生成三元组集合;拆分三元组集合获得实体关系表并进行去重,获得滑坡知识图谱,导入至Neo4j数据库。通过本发明提升了滑坡知识图谱的建立效率。
本发明授权一种基于微调ChatGLM2的滑坡知识图谱智能生成方法在权利要求书中公布了:1.一种基于微调ChatGLM2的滑坡知识图谱智能生成方法,其特征在于,所述方法包括如下步骤:S1:收集第一数据信息,基于Python程序将所述第一数据信息批量处理成文本格式,所述第一数据信息包括与滑坡相关的科技文献、灾害事件以及社交媒体资料;S2:对转换为所述文本格式的所述第一数据信息进行初步清洗,所述Python程序按照句号作为分隔符,将初步清洗后的所述第一数据信息划分为多条语句信息,基于正则表达式对所述语句信息进行深度清洗获得第二数据信息;S3:构建问答模板,将所述第二数据信息输入第一版本的大语言模型,所述第一版本的大语言模型基于所述问答模板对所述第二数据信息进行三元组粗划分,对粗划分后的所述三元组进行人工校对获得三元组数据集,其中,所述第一版本为ChatGLM2130B版本;S4:基于P-tuningv2模型微调技术对第二版本的大语言模型的参数进行训练,其中,所述第二版本为ChatGLM26B版本;S5:将训练后的所述参数加载到所述第二版本的大语言模型中,并输入所述三元组数据集生成三元组集合;S6:基于所述Python程序拆分所述三元组集合,获得实体关系表,融合最小编辑距离和Jaccard方法对所述实体关系表进行去重;对所述实体关系表进行去重包括以下步骤:基于第一公式计算字符串A和字符串B的第一相似度,所述第一公式为:,其中,为所述字符串A和所述字符串B之间的最小编辑距离,为所述字符串A和所述字符串B的Jaccard相似度,和为第一权重和第二权重,为所述字符串A的长度计算公式,为所述字符串B的长度计算公式,为最大值计算公式,将所述实体关系表中的实体和关系转化为字符串形式,若两个字符串的所述第一相似度大于第一阈值,则表示两个所述字符串发生重复,去除两个所述字符串中的任意一个字符串;步骤S7:将去重后的所述实体关系表批量导入第一数据库,构建滑坡知识图谱并进行可视化展示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人郑州大学,其通讯地址为:450000 河南省郑州市高新技术开发区科学大道100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。