买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及地理知识图谱嵌入技术领域,具体公开了一种顾及时间特征的地理知识图谱隐式推理模型构建方法,包括以下步骤:首先,实体编码器将任意一个包含时间信息的地理知识图谱嵌入到向量空间中;而后,投影算子执行链接预测操作,将实体与关系在空间上进行计算得到预测向量;通过交集算子处理逻辑查询中的逻辑与操作,在多个实体集合间找到共同的实体;构建最大边界损失函数用于模型训练;制定评价指标用于评价模型性能;最后,进行模型训练与参数设置。本发明采用上述的一种顾及时间特征的地理知识图谱隐式推理模型构建方法,对时间信息进行编码,将时间维度的信息转化为数值型特征,增强了地理知识图谱的表达能力并提高查询的准确度和效率。
主权项:1.一种顾及时间特征的地理知识图谱隐式推理模型构建方法,包括以下步骤:S1、利用实体编码器将任意一个包含时间信息的知识图谱嵌入到d维的向量空间中;S2、投影算子执行链接预测操作,将实体与关系在空间上进行计算得到预测向量;S3、通过交集算子处理逻辑查询中的逻辑与操作,在多个实体集合之间找到共同的实体;S4、构建最大边界损失函数用于模型训练;S5、制定评价指标用于评价模型性能;S6、模型训练与参数设置;步骤S1中,所述实体编码器分为实体特征编码器和时间特征编码器,所述实体特征编码器将任意一个地理知识图谱中的实体嵌入到维的向量空间中;对于任意一个实体,实体特征编码器将通过嵌入查找方法来计算实体的嵌入: 其中,是地理知识图谱中所有实体类型的嵌入矩阵,表示实体在地理知识图谱中的one-hot向量,因此,将进行嵌入查找操作,从相应的列中获得实体嵌入,表示L2范数;所述时间特征编码器将任意一个实体的时间嵌入到向量空间中,所述时间信息包括时间点和时间段两种尺度,所述时间特征编码器用于处理时间不同尺度的信息:若一个地理实体所包含的时间信息为时间点时,则采用其现代标准时间作为的输入;若一个地理实体所包含的时间信息为时间段时,则采用降维的方式,将二维的时间段降维成一维的时间点,作为的输入;对于地理知识图谱中非地理实体或者地理实体缺少时间信息的,时间特征将采用零向量进行补齐操作;因此,对于任意一个地理知识图谱中的地理实体,时间特征编码器将地理实体的时间信息编码为,表示为以下公式: 其中,表示时间点,表示时间段降维后的时间点,且∈;所述降维方法包括首端采样、尾端采样和随机采样,所述首端采样表示采用时间段的开始时间来表示时间段,所述尾端采样表示采用时间段的结束时间来表示时间段,所述随机采样表示在时间段中随机选取一个时间点来表示该时间段,将时间段进行降维之后,采用时间点编码方式,对降维后的时间点进行编码表示;所述实体编码器分为实体特征编码器和时间特征编码器,则步骤S1中,所述实体编码器将任意一个地理知识图谱中的实体嵌入到维的向量空间中表示为: 其中,[;]表示特征向量的拼接,;步骤S2中,对于给定的地理知识图谱,投影算子执行链接预测操作,将实体与关系在空间上进行计算得到预测向量,根据输入对象的不同,投影算子分为两种类型:和; 处理的输入是一个三元组的头实体和关系,预测尾实体;处理的是逻辑查询中的基本图查询模型,是由存在量词约束的的向量嵌入,去预测的向量嵌入, 其中,和是可训练的关系矩阵,和的作用分别是特征嵌入和时间嵌入;步骤S3中,采用基于自注意力机制的交集算子从多个嵌入中进行交集操作,获得查询嵌入中的单一目标节点的嵌入,表示为: 交集算子中采用向量中元素平均值、最小值和最大值或者采用DeepSets排列不变的神经网络结构;步骤S4中,所述模型训练包括地理知识图谱的训练阶段和地理知识图谱问答对的训练;在地理知识图谱的训练阶段,训练的数据源为地理知识图谱G本身的结构,对于,任意一个节点:首先从地理知识图谱的三元组中获得节点所有的一度邻居节点,从负样本集中采样n组负样本,该阶段模型训练策略是预测出节点的嵌入最接近正样本的嵌入,并且远离负样本集中的每一个负样本的嵌入,即预测节点的嵌入越接近正样本越好,越远离负样本越好,由此构建出最大边界损失函数: 其中表示计算向量之间的距离;在地理知识图谱问答对的训练阶段,训练的数据源为人工构建的地理知识图谱问答对,对于,任意一个问答对均遵循基本的查询子图模式,该阶段模型训练目标是将正确的答案节点嵌入最接近问题的预测嵌入,并且远离所有负样本集中的所有负样本节点的嵌入,因此,本阶段的训练损失函数采用以下最大边界损失: 。
全文数据:
权利要求:
百度查询: 合肥工业大学 中国科学院地理科学与资源研究所 一种顾及时间特征的地理知识图谱隐式推理模型构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。