中国人民解放军军事科学院系统工程研究院凌晨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军军事科学院系统工程研究院申请的专利一种基于大语言模型的知识图谱构建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119047553B 。
龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411053000.8,技术领域涉及:G06N5/022;该发明授权一种基于大语言模型的知识图谱构建方法及系统是由凌晨;唐凯;孙晖设计研发完成,并于2024-08-01向国家知识产权局提交的专利申请。
本一种基于大语言模型的知识图谱构建方法及系统在说明书摘要公布了:本发明涉及文本处理技术领域,并具体公开了一种基于大语言模型的知识图谱构建方法及系统,包括:基于源文本的所有源文本分句获得源文本的所有预文本处理分句;基于源文本的所有预文本处理分句和预设大语言模型获得源文本的所有预文本处理分句内的所有提取实体和源文本的所有文本处理分句;基于源文本的所有文本处理分句的所有提取实体获得源文本的所有第二判定相似实体组,基于源文本的所有第二判定相似实体组获得源文本的所有文本处理分句的所有标准提取实体;基于源文本的所有文本处理分句的所有标准提取实体获得知识图谱构建结果。本发明准确地将含义相同的提取实体归类,准确地进行了知识图谱的简化,提高了知识图谱构建的效率和准确性。
本发明授权一种基于大语言模型的知识图谱构建方法及系统在权利要求书中公布了:1.一种基于大语言模型的知识图谱构建方法,其特征在于,包括:S1:对源文本进行数据预处理,获得源文本的所有源文本分句,基于源文本的所有源文本分句获得源文本的所有预文本处理分句;S2:基于源文本的所有预文本处理分句和预设大语言模型获得源文本的所有预文本处理分句内的所有提取实体和所有提取关系,基于所有预文本处理分句的所有提取实体获得源文本的所有文本处理分句;S3:基于源文本的所有文本处理分句的所有提取实体获得源文本的所有第一判定相似实体组,并基于源文本的所有文本处理分句和所有第一判定相似实体组,获得源文本的所有文本分句组,基于源文本的所有文本分句组获得源文本的所有第二判定相似实体组,基于源文本的所有第二判定相似实体组获得源文本的所有文本处理分句的所有标准提取实体;S4:基于源文本的所有文本处理分句的所有标准提取实体和所有预文本处理分句内的提取关系获得知识图谱构建结果;其中,基于源文本的所有文本处理分句和所有第一判定相似实体组,获得源文本的所有文本分句组,包括:将每个第一判定相似组内的两个提取实体,判定为互为第一同类实体,并将源文本中所有互为第一同类实体的提取实体汇总作为第一同类判定相似组;将第一同类判定相似组内所有提取实体中,在源文本中的出现次数最多的提取实体当作第一替换实体,并利用所有第一替换实体替换源文本的所有文本处理分句中,对应第一同类判定相似组内除对应第一替换实体以外剩余的所有提取实体,获得源文本的所有文本分句;若第一同类判定相似组内所有提取实体在源文本的出现次数相同时,则将第一同类判定相似组内所有提取实体中,在源文本中最先出现的提取实体当作第一替换实体,并利用所有第一替换实体替换源文本的所有文本处理分句中,对应第一同类判定相似组内除对应第一替换实体以外剩余的所有提取实体,获得源文本的所有文本分句;将源文本的每个文本分句以及对应的相邻前一文本分句和对应的相邻后一文本分句组合,获得所有文本分句组。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军军事科学院系统工程研究院,其通讯地址为:100166 北京市丰台区丰体南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。