浪潮通用软件有限公司梁格获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮通用软件有限公司申请的专利基于结构语义图嵌入的多模态数学文献检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120723897B 。
龙图腾网通过国家知识产权局官网在2026-01-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511231851.1,技术领域涉及:G06F16/334;该发明授权基于结构语义图嵌入的多模态数学文献检索方法及系统是由梁格;路宽;丁一凡;杜宏伟;王建;刘继乔;王威设计研发完成,并于2025-09-01向国家知识产权局提交的专利申请。
本基于结构语义图嵌入的多模态数学文献检索方法及系统在说明书摘要公布了:本发明属于人工智能与信息检索领域,提供了一种基于结构语义图嵌入的多模态数学文献检索方法及系统,将文献内容进行转换,形成三元组结构,提取三元组结构中的LaTeX公式的表达式,构建抽象语法树,将抽象语法树转化为结构语义图,利用预训练的模型对结构语义图进行编码,提取语义嵌入向量,形成公式嵌入向量;利用预训练语言模型对三元组结构的正文段落进行语义建模,生成文本嵌入向量;基于公式嵌入向量和文本嵌入向量,构建检索索引结构;响应于用户的查询请求,对查询请求进行模态识别,根据识别的模态进行处理,生成语义信息,根据所述语义信息在检索索引结构进行查询。本发明提高了数学文献检索的准确性。
本发明授权基于结构语义图嵌入的多模态数学文献检索方法及系统在权利要求书中公布了:1.一种基于结构语义图嵌入的多模态数学文献检索方法,其特征是,包括以下步骤: 获取多源异构数学文献,对其进行转化,将不同格式的数学文献内容转化为统一的三元组结构,三元组结构包括正文段落、LaTeX公式和元信息; 提取三元组结构中的LaTeX公式的表达式,进行解析,构建抽象语法树表示LaTeX公式中的语法关系与运算层次,将抽象语法树转化为结构语义图,结构语义图中图的节点表示公式中的各个组成元素,边表示组成元素之间的语义或结构关系; 利用预训练的模型对结构语义图进行编码,提取出全局一致的语义嵌入向量,形成公式嵌入向量;过程包括:利用预训练的图卷积网络模型对结构语义图进行编码,节点代表数学公式中的组成元素,边则表示它们之间的结构或语义关系,通过层层特征聚合机制,实现对整个公式结构的嵌套关系、运算优先级和符号依赖的建模,提取出全局一致的语义嵌入向量; 且在训练过程中引入图的结构特征作为输入特征,并利用对比学习算法和自监督学习算法增强图卷积网络模型对结构相似但语义不同、或结构不同但语义近似的公式的辨别能力;所述结构特征包括节点类型、位置嵌入和深度信息; 利用预训练语言模型对三元组结构的正文段落进行语义建模,生成嵌入向量表示,以捕捉正文段落中和数学公式相关的隐含语义,生成文本嵌入向量; 基于公式嵌入向量和文本嵌入向量,构建检索索引结构;过程包括:采用融合策略将公式嵌入向量和文本嵌入向量进行融合,对所有文献融合后的向量进行统一归一化,并构建向量化检索索引; 在构建向量化检索索引时,按段落级构建索引或将整篇文献的多个三元组语义向量聚合为文献级向量,实现多层次检索; 响应于用户的查询请求,对查询请求进行模态识别,根据识别的模态进行处理,生成语义信息,根据所述语义信息在检索索引结构进行查询,将查询结果封装为结构化语义向量,结构化语义向量包括文本嵌入、公式嵌入、模态标记及元信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮通用软件有限公司,其通讯地址为:250000 山东省济南市历下区浪潮路1036号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励