着陆页(北京)科技有限公司谷锎获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉着陆页(北京)科技有限公司申请的专利一种基于大模型的知识图谱构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120996165B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510861589.2,技术领域涉及:G06N5/025;该发明授权一种基于大模型的知识图谱构建方法是由谷锎;李春朋;赵科笼设计研发完成,并于2025-06-25向国家知识产权局提交的专利申请。
本一种基于大模型的知识图谱构建方法在说明书摘要公布了:本发明涉及数据模型构建技术领域,且公开了一种基于大模型的知识图谱构建方法,包括:对数据库中的数据进行语料收集和领域划分,判断每个词语在每个领域内的含义,判断每个词语在每个领域内是否存在特殊含义,对标记词语进行检验分析,生成一级知识图谱,并分析词语在领域内的重要程度,生成二级知识图谱,该基于大模型的知识图谱构建方法,实现对不同领域知识的系统化整合与展示,提升知识的组织和管理效率,精准分析词语在不同领域的语义和特殊含义,提高知识图谱的准确性和可靠性,增强知识图谱中信息的可靠性和权威性,实现知识图谱的个性化展示,满足不同层次用户的需求,提升用户体验帮助用户快速获取所需信息,提高工作效率。
本发明授权一种基于大模型的知识图谱构建方法在权利要求书中公布了:1.一种基于大模型的知识图谱构建方法,其特征在于:包括: 对数据库中的数据进行语料收集和领域划分; 对数据库中的每个词语,执行词语领域分析,判断该词语在每个领域内的含义; 对数据库中的每个词语,执行词语特殊含义分析,判断该词语在每个领域内是否存在特殊含义; 对每个词语,获取其标记信息; 若词语存在标记信息,则对标记词语进行检验分析; 对检验分析后仍然存在标记信息的词语,生成一级知识图谱,并分析词语在领域内的重要程度; 根据词语在领域内的重要程度,生成二级知识图谱; 若词语不存在标记信息,则不对该词语执行任何操作; 词语特殊含义分析,具体为: 对于每个领域,定义领域术语集合: ; 其中,表示该领域的一个专业术语,为术语数量; 设置一个术语匹配判断函数,对于数据库中的每个词语,判断其是否属于领域的术语集合: ; 若,则判定词语在领域内为专业术语,存在特殊含义,标记该词语和领域,生成标记信息: ; 保存特殊含义的描述; 若,则判定词语在领域内不是专业术语,不存在特殊含义,不生成标记信息; 针对每个领域,构建领域文本语料库; 对于词语在领域的文本语料库中,计算词语在领域文本中的出现频率,定为使用频率: ; 统计词语在领域文本中的常见搭配模式; 找出与的频繁共现词语集合,并计算其支持度和置信度等指标; 分析词语在领域文本中的上下文语境特征: ; 根据词语在领域的特征计算综合得分: ; 其中,、以及为特殊表达判断的综合权重系数,为使用频率权重,为搭配模式权重,为上下文语境权重,表示搭配模式的置信度; 设置一个特殊表达判定函数,判断词语在领域内是否存在特殊表达: ; 其中,为特殊表达判定阈值; 若,则判定词语在领域内存在特殊表达,具有特殊含义,标记该词语和领域,记录标记信息: ; 保存特殊含义的描述; 若,则判定词语在领域内不存在特殊表达,不存在特殊含义,不生成标记信息; 对标记词语进行检验分析,具体为: 对于每个存在标记的词语和其标记的领域,定义多源数据集合: ; 其中,每个代表一个数据源,为数据源数量; 根据数据源的可靠性、权威性和相关性,为每个数据源设定权重: ; 其中,为可靠性权重系数,为权威性权重系数,为相关性权重系数; 定义一个支持关系集合: ; 其中,每个表示一种支持关系; 对于每个数据源,定义其关于词语在领域内的描述和解释集合; 对于每个数据源,判断其描述和解释集合中是否存在至少一个元素与支持关系集合中的元素匹配: ; 若,则判定数据源明确指出词语在领域内具有特殊含义; 若,则判定数据源明确指出词语在领域内不具有特殊含义; 若数据源明确指出词语在领域内具有特殊含义,则记; 否则,记; 计算词语在领域内特殊含义的综合验证得分: ; 设置一个可信度判定函数,判断词语在领域内的特殊含义标记是否具有较高的可信度: ; 其中,为综合验证得分阈值; 若,则认为词语在领域内的特殊含义标记具有较高的可信度,保留该标记; 若,则认为词语在领域内的特殊含义标记不具有较高的可信度,定义权威数据源集合,非权威数据源集合; 其中,和互不相交且; 定义领域内所有数据源对词语的特殊含义支持度集合: ; 其中,表示数据源是否支持词语在领域内具有特殊含义; 计算权威数据源集合中支持词语在领域内具有特殊含义的数据源数量: ; 定义一个评估判定函数,判断词语是否保留标记: ; 其中,表示保留标记,表示人工判断,表示取消标记,为非权威支持阈值,为权威支持阈值,为非权威数据源集合中支持词语在领域内具有特殊含义的数据源数量,具体公式为: ; 生成一级知识图谱,具体为: 创建词语节点集合: ; 其中,每个代表一个被确定在领域内存在特殊含义的词语节点; 创建领域节点集合: ; 其中,每个代表一个标记的领域节点; 对于每个词语节点,设置其属性集合: ; 其中,为词语名称,为词语的基本信息,为在领域内的特殊含义描述; 对于每个领域节点,设置其属性集合: ; 其中,为领域名称,为领域简介; 创建关系集合: ; 其中,每个代表词语节点与领域节点之间的语义关联关系; 定义关系类型集合: ; 遍历所有存在标记的词语及其标记的领域,根据标记的类型,确定关系类型,记为; 创建关系,并将其加入关系集合; 结合词语节点集合、领域节点集合以及关系集合,形成一级知识图谱的基本结构; 生成二级知识图谱,具体为: 对于每个存在标记的词语节点和其关联的领域节点,根据重要程度分析结果,定义节点可见性属性: ; 获取词语在领域内的重要程度; 若词语在领域内的重要程度分类为“高”,则将词语在领域内的应用场合标记为显示知识图谱节点; 若词语在领域内的重要程度分类为“低”,则将词语在领域内的应用场合标记为隐藏知识图谱节点; 定义用户集合: ; 为每个用户定义身份属性: ; 若,则判定用户的身份为专业用户; 若,则判定用户的身份为普通用户; 为每个用户定义认证状态: ; 用户提交认证信息; 定义审核通过的条件; 若,则判定通过权限认证,记为; 若,则判定未通过权限认证,记为; 若用户的身份为专业用户且通过权限认证,则允许访问隐藏节点 生成二级知识图谱,还包括: 获取显示节点集合: 获取隐藏节点集合: 将显示节点集合和隐藏节点集合整合到二级知识图谱的节点集合中: 将显示节点之间的关系集合和隐藏节点之间的关系集合整合到二级知识图谱的关系集合中: 根据整合后的节点集合和关系集合,构建二级知识图谱: ; 对于用户查询请求,根据用户身份和节点可见性属性,若,则向用户展示该节点及其相关关系; 若,若用户的身份为专业用户且通过权限认证,则向用户展示该节点及其相关关系; 若,若用户的身份为普通用户或未通过权限认证,则不向用户展示隐藏节点及其关系。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人着陆页(北京)科技有限公司,其通讯地址为:100070 北京市丰台区航丰路1号院5号楼3至17层301;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励