Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国科学院文献情报中心宋东桓获国家专利权

恭喜中国科学院文献情报中心宋东桓获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国科学院文献情报中心申请的专利专业领域科技术语挖掘与聚合技术方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119003789B

龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411205020.2,技术领域涉及:G06F16/36;该发明授权专业领域科技术语挖掘与聚合技术方法是由宋东桓;胡懋地;钱力;刘熠设计研发完成,并于2024-08-30向国家知识产权局提交的专利申请。

专业领域科技术语挖掘与聚合技术方法在说明书摘要公布了:本申请提供了一种专业领域科技术语挖掘与聚合技术,涉及科技实体对齐技术领域,包括:基于科技实体要素抽取结果构建目标科技图谱;通过图编码器对目标科技图谱进行编码,输出图节点向量;进行科技术语识别,获取科技术语;提取科技术语的上下文信息,结合大语言模型生成术语相关定义,编码输出术语定义文本向量;在文本对齐过程中对图编码器进行微调优化,得到优化图编码器嵌入大语言模型框架中,通过融合图结构信息的大语言模型对待识别术语进行聚合。通过本申请可以解决现有技术在处理科技术语间复杂关系和语义相似性时,往往缺乏足够的灵活性和准确性,导致科技术语对齐的精准性和可靠性较差的技术问题。

本发明授权专业领域科技术语挖掘与聚合技术方法在权利要求书中公布了:1.一种专业领域科技术语挖掘与聚合技术的方法,其特征在于,包括:以专业领域学科范围为约束,检索获取样本科技文献集,对所述样本科技文献集进行预处理,得到标准科技文献集;利用大语言模型,按照预定抽取策略对所述标准科技文献集进行科技实体要素抽取,基于科技实体要素抽取结果构建目标科技图谱;通过图编码器对所述目标科技图谱进行编码,输出图节点向量;基于预定识别规则,对所述科技实体要素抽取结果进行科技术语识别,获取科技术语,其中,预定识别规则包括实体类型层面、术语长度层面和术语频次层面;基于上下文感知机制,利用关键词提取所述标准科技文献集中科技术语的上下文信息,结合大语言模型生成术语相关定义,通过大语言模型中的文本编码器对所述术语相关定义进行编码,输出术语定义文本向量;执行所述图节点向量和所述术语定义文本向量的文本逐步对齐,在文本对齐过程中对所述图编码器进行微调优化,得到优化图编码器;将所述优化图编码器嵌入大语言模型框架中,生成融合图结构信息的大语言模型,通过所述融合图结构信息的大语言模型对待识别术语进行聚合;基于科技实体要素抽取结果构建目标科技图谱,包括:配置预定抽取策略,其中,所述预定抽取策略包括实体抽取、关系抽取和属性抽取;利用大语言模型,按照所述预定抽取策略对所述标准科技文献集进行科技实体要素抽取,得到要素抽取结果;基于图计算原理,将实体和属性设为图中节点,将实体关系设为图的边,根据所述要素抽取结果进行图仿真,生成所述目标科技图谱;输出图节点向量,包括:基于图卷积网络构建初始图编码器,其中,所述初始图编码器包括多个图卷积层;基于预定损失函数,以最小化交叉熵损失为训练目的,通过样本数据集对所述初始图编码器进行监督训练,得到符合预期收敛指标的图编码器;通过所述图编码器对所述目标科技图谱进行编码,输出所述图节点向量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院文献情报中心,其通讯地址为:100190 北京市海淀区中关村北四环西路33号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。