北京航空航天大学谭火彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京航空航天大学申请的专利基于最优传输的异配文本属性图节点分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120973943B 。
龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511500414.5,技术领域涉及:G06F16/35;该发明授权基于最优传输的异配文本属性图节点分类方法及系统是由谭火彬;任亚亭;丁宗亚;林广艳设计研发完成,并于2025-10-21向国家知识产权局提交的专利申请。
本基于最优传输的异配文本属性图节点分类方法及系统在说明书摘要公布了:本发明提出一种基于最优传输的异配文本属性图节点分类方法及系统,属于图神经网络与自然语言处理领域,本发明针对文本属性图中结构与文本之间存在的多粒度异配的问题,通过融合大规模语言模型、预训练语言模型与图神经网络,提出了一种层次化的结构‑文本对齐机制。具体而言,在细粒度层面,采用一种最大值的平滑近似机制,捕捉文本中关键词与邻居节点之间的双向关键交互关系;在粗粒度层面,引入过滤提示机制以抑制无效或噪声匹配;通过最优传输实现结构与文本分布的柔性对齐。将最优传输匹配作为对比学习的辅助监督信号,引导错误负样本挖掘,缓解文本语义相近但未连接节点之间的表示偏差。本发明提供了结构与文本信息融合与对齐的新方法。
本发明授权基于最优传输的异配文本属性图节点分类方法及系统在权利要求书中公布了:1.一种基于最优传输的异配文本属性图节点分类方法,其特征在于,包括: 步骤S1:利用公开数据源或网络爬取方式采集原始数据,并对原始数据进行预处理,包括数据清洗,文本标准化,分词处理,构建文本属性图数据,包括:节点集合、边集合、与节点相关的文本、节点初始特征矩阵和节点类别的独热编码矩阵; 步骤S2:基于所述文本属性图数据,构造与其类别相关的提示词模板,将所述提示词与原始文本一同输入至大规模语言模型,以生成解释性文本,并将该解释性文本与原始文本拼接,得到增强文本; 步骤S3:基于所述增强文本,利用预训练语言模型提取节点的节点级文本嵌入向量和词级嵌入矩阵;同时,基于边集合与节点初始特征,利用图神经网络提取节点结构嵌入向量,利用线性变换得到邻居嵌入矩阵; 步骤S4:采用一种最大值的平滑近似机制,分别在词与邻居间计算双向的相关关系,形成细粒度的相似度矩阵;引入过滤提示机制向量,扩展相似度矩阵;基于所述扩展相似度矩阵,通过行列归一化的迭代矩阵求解算法求得最优传输分配矩阵;基于所述最优传输分配矩阵构建结构-文本对齐损失,作为结构-文本对齐的优化目标,包括如下步骤: 步骤S41:计算与之间的余弦相似度,形成全局相似度矩阵,其中,为节点结构嵌入向量,为词级文本嵌入矩阵; 步骤S42:使用一种最大值的平滑近似机制,计算节点的邻域结构嵌入与文本的词级嵌入之间的细粒度相似度为: ; 其中,是邻居数量,是分词的数量,是平滑最大值操作的温度参数,表示对数函数,exp表示指数函数,·表示向量内积,是节点的第个邻居的结构嵌入向量,是文本的第个分词的词级文本嵌入向量,是文本的第个分词的词级文本嵌入向量,是节点的第个邻居的结构嵌入向量; 步骤S43:融合和,得到整体的结构-文本相似度矩阵; 步骤S44:在上扩展一个新的行向量和列向量,并为它们填充相同的概率值,构成最终的扩展相似度矩阵: ; 步骤S5:构建挖掘负样本损失函数,用于挖掘错误负样本; ; 其中,为单位目标,为辅助对齐目标,为控制相似度分布集中度的温度参数; 步骤S6:将所述节点结构嵌入向量与所述节点级文本嵌入向量进行融合,生成节点的最终嵌入向量,并将其输入至分类器中,输出节点类别预测概率; 步骤S7:基于所述结构-文本对齐损失、所述挖掘负样本损失函数和节点分类损失构建整体损失函数,用于模型训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励