买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:时代新媒体出版社有限责任公司
摘要:本发明提供了一种基于深度学习的古籍文本实体关系抽取方法及系统,涉及古籍识别处理技术领域,该方法旨在提高古籍文本处理的准确性和效率。系统通过融合多模态信息(文字和插图)、自注意力机制、图神经网络及动态知识图谱技术,实现了对古籍文本中实体及其关系的精准识别和抽取。该方法有效处理了古籍中文言文的复杂语法结构,确保长距离依赖关系的捕捉。通过构建和实时更新知识图谱,系统大大提升了知识管理的效能。此技术降低了人工干预,实现了古籍处理的自动化和大规模应用,促进了文化遗产的保护和学术研究的进展。
主权项:1.一种基于深度学习的古籍文本实体关系抽取方法,其特征在于,该方法包括以下步骤:收集古籍文本,对古籍文本进行分词、词性标注和命名实体识别,并对古籍中的插图和图表进行图像增强处理;提取古籍插图和图表中的图像特征,提取古籍文本的文本特征,通过特征融合层将图像特征和文本特征结合,生成多模态特征向量;使用多头自注意力机制从多模态特征向量中提取上下文信息,捕捉文本中的长距离依赖关系,并应用注意力机制对多模态特征向量进行加权处理;根据古籍文本中的实体和长距离依赖关系构建图结构,利用图神经网络对图结构进行嵌入学习,提取节点和边的特征;通过多模态特征向量进行节点和边的嵌入学习,使用学习得到的图嵌入特征进行关系预测,识别实体关系;基于图结构和识别出的实体关系构建动态知识图谱结构,实时更新抽取出的实体和关系信息。
全文数据:
权利要求:
百度查询: 时代新媒体出版社有限责任公司 一种基于深度学习的古籍文本实体关系抽取方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。