买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请提供了一种专业领域科技术语挖掘与聚合技术,涉及科技实体对齐技术领域,包括:基于科技实体要素抽取结果构建目标科技图谱;通过图编码器对目标科技图谱进行编码,输出图节点向量;进行科技术语识别,获取科技术语;提取科技术语的上下文信息,结合大语言模型生成术语相关定义,编码输出术语定义文本向量;在文本对齐过程中对图编码器进行微调优化,得到优化图编码器嵌入大语言模型框架中,通过融合图结构信息的大语言模型对待识别术语进行聚合。通过本申请可以解决现有技术在处理科技术语间复杂关系和语义相似性时,往往缺乏足够的灵活性和准确性,导致科技术语对齐的精准性和可靠性较差的技术问题。
主权项:1.专业领域科技术语挖掘与聚合技术,其特征在于,包括:以专业领域学科范围为约束,检索获取样本科技文献集,对所述样本科技文献集进行预处理,得到标准科技文献集;利用大语言模型,按照预定抽取策略对所述标准科技文献集进行科技实体要素抽取,基于科技实体要素抽取结果构建目标科技图谱;通过图编码器对所述目标科技图谱进行编码,输出图节点向量;基于预定识别规则,对所述科技实体要素抽取结果进行科技术语识别,获取科技术语,其中,预定识别规则包括实体类型层面、术语长度层面和术语频次层面;基于上下文感知机制,利用关键词提取所述标准科技文献集中科技术语的上下文信息,结合大语言模型生成术语相关定义,通过大语言模型中的文本编码器对所述术语相关定义进行编码,输出术语定义文本向量;执行所述图节点向量和所述术语定义文本向量的文本逐步对齐,在文本对齐过程中对所述图编码器进行微调优化,得到优化图编码器;将所述优化图编码器嵌入大语言模型框架中,生成融合图结构信息的大语言模型,通过所述融合图结构信息的大语言模型对待识别术语进行聚合。
全文数据:
权利要求:
百度查询: 中国科学院文献情报中心 专业领域科技术语挖掘与聚合技术
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。