买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供一种基于知识图谱的多模异构录取数据集成方法,涉及数据集成与处理技术领域,步骤包括S1:采集各省市与高考相关的基础数据,根据基础数据提取三元组并对三元组进行优化补充;S2:根据优化后的三元组构建neo4j图数据库,生成基于知识图谱的数据统一模型;S3:采集各省市历年的录取数据文件、集成记录、招录规则方案,并基于各省市的高考模式信息训练数据集成的映射规则,生成集成处理模型;S4:连接数据统一模型的输出端与集成处理模型的输入端,构建组合模型,并利用组合模型进行数据的统一集成处理输出。本发明通过构建数据统一模型和集成处理模型,将原问题拆解为两个小问题,更加适用于计算机进行处理,减少人为错误,正确率更高。
主权项:1.一种基于知识图谱的多模异构录取数据集成方法,其特征在于,包括如下步骤:S1:采集各省市与高考相关的基础数据,根据基础数据提取三元组并对三元组进行优化补充;S2:根据优化后的三元组构建neo4j图数据库,生成基于知识图谱的数据统一模型;步骤S2中所述数据统一模型的生成逻辑为:S201:根据优化后的三元组构建图结构,并将实体和关系作为图的节点,三元组作为图的边;S202:构建neo4j图数据库来对三元组进行存储,利用图神经网络来对三元组进行训练,并在每一层配置训练函数;S203:通过反向传播算法计算并更新训练函数的梯度,再通过随机梯度下降算法对数据统一模型的参数进行更新,直至数据统一模型的损失趋于稳定;所述训练函数包括用于在邻居节点提取信息的消息传递聚合函数、用于将邻居节点和中心节点进行信息特征融合的邻居特征聚合函数、用于更新中心节点特征表示的更新函数,具体计算公式如下:消息传递聚合函数:邻居特征聚合函数:更新函数:式中表示节点i在第l层的聚合结果,Ni表示节点i的邻居节点集合,表示节点i在第l层的特征表示,cij表示归一化常数,Wl表示第l层的权重矩阵,σ表示激活函数;S3:采集各省市历年的录取数据文件、集成记录、招录规则方案,并基于各省市的高考模式信息训练数据集成的映射规则,生成集成处理模型;步骤S3中所述集成处理模型的生成逻辑为:S301:引入神经网络进行训练,基于两层神经网络层衔接一层全连接层来构建出三层单向网络的集成处理模型;S302:初始化集成处理模型的模型参数,设置两层神经网络层和一层全连接层的隐藏神经元、学习率、激活函数和迭代次数;S303:以录取数据文件、集成记录、当年目标数据字典作为集成处理模型的输入,训练出各省市数据集成的映射规则,完成对集成处理模型的优化迭代;S4:连接数据统一模型的输出端与集成处理模型的输入端,构建组合模型,并利用组合模型进行数据的统一集成处理输出。
全文数据:
权利要求:
百度查询: 新疆泽智信息技术有限公司 一种基于知识图谱的多模异构录取数据集成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。