北京石油化工学院王芳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京石油化工学院申请的专利一种基于图卷积神经网络的中文短文本联合实体消歧方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120493913B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510582533.3,技术领域涉及:G06F40/279;该发明授权一种基于图卷积神经网络的中文短文本联合实体消歧方法及系统是由王芳;张柘元;崔宁;卓政;季亦然;彭畅;肖黎宪;徐凯风;郭飞扬设计研发完成,并于2025-05-07向国家知识产权局提交的专利申请。
本一种基于图卷积神经网络的中文短文本联合实体消歧方法及系统在说明书摘要公布了:本发明公开了一种基于图卷积神经网络的中文短文本联合实体消歧方法及系统,包括:获取原始短文本,获取每个实体指称的候选实体集合,生成训练数据集;对训练数据集进行训练,得到实体指称与每个候选实体的相似度得分;对原始短文本进行分词和依存句法分析,根据分析结果转换为图数据,并将候选实体作为节点添加至图数据中,得到邻接矩阵,使用word2vec对每个节点进行编码,得到特征矩阵;构建GCN实体消歧模型,并将相似度得分作为权重融入邻接矩阵,将特征矩阵和带有权重的邻接矩阵输入到GCN实体消歧模型中训练;输出每个节点特征向量,使用全连接层得到每个候选实体节点的全局特征分数,根据全局特征分数进行排序,完成实体消歧。
本发明授权一种基于图卷积神经网络的中文短文本联合实体消歧方法及系统在权利要求书中公布了:1.一种基于图卷积神经网络的中文短文本联合实体消歧方法,其特征在于,所述方法包括: 获取包含实体指称的原始短文本,并根据现有知识库获取每个实体指称的候选实体集合,生成训练数据集; 使用BERT+BiLSTM模型对所述训练数据集进行训练,得到实体指称与所述候选实体集合中每个候选实体的相似度得分; 使用LTP对所述原始短文本进行分词和依存句法分析,将分析结果转换为图数据,并将候选实体作为节点添加至图数据中,得到完整图数据的邻接矩阵,再使用word2vec对每个节点进行编码,得到完整图数据的特征矩阵; 计算每个相连节点之间的余弦相似度,作为边关系的权重融入邻接矩阵,构建PinSageGCN实体消歧模型,将所述特征矩阵和带有权重的邻接矩阵输入到PinSageGCN实体消歧模型中开始训练,更新节点特征; 通过PinSageGCN实体消歧模型获得各个节点经过多层迭代的特征,基于四种边关系利用四个PinSageGCN实体消歧模型即异构PinSageGCN模型,完成实体消歧任务; 将所述特征矩阵和带有权重的邻接矩阵输入到PinSageGCN中开始训练,更新节点特征的方法包括: 根据所得邻接矩阵获取节点的邻居节点,对每个节点i,j表示某一邻居节点,邻居节点集合为: ; 同时利用图结构中节点之间关系的信息和节点特征向量中的语义信息,计算节点邻居消息分发及聚合向量;对每个节点i,邻居节点集合为; ; 其中,Dense为全连接层网络,表示聚合; 根据节点i的特征向量也在全连接层中进行更新: ; 其中,表示节点自更新的特征向量; 将邻居聚合信息与节点自身编码相加并正则化,得到新的节点向量表示,即为该节点在训练过程中的迭代: ; 其中,表示节点更新特征的中间结果,表示新的节点向量表示; 通过PinSageGCN实体消歧模型获得各个节点经过多层迭代的特征,基于四种边关系利用四个PinSageGCN实体消歧模型即异构PinSageGCN模型,完成实体消歧任务的方法包括: 以四种类型的边关系为基础,使用异构PinSageGCN的方式进行训练,输出每个节点在四种边关系下的节点特征,将节点的各个特征融合并拼接并利用全连接层得到候选实体节点特征分数,再结合相似度得分进行联合学习,得到每个候选实体节点的联合消歧分数,根据联合消歧分数进行排序,并以标注监督PinSageGCN实体消歧模型训练,最终完成实体消歧。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京石油化工学院,其通讯地址为:102627 北京市大兴区大兴清源北路19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励