恭喜福建省鲸航网络科技有限公司王鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜福建省鲸航网络科技有限公司申请的专利一种基于深度学习模型的创建结构化文档的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119558307B 。
龙图腾网通过国家知识产权局官网在2025-05-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510115384.X,技术领域涉及:G06F40/205;该发明授权一种基于深度学习模型的创建结构化文档的方法是由王鹏;黄晓华;马明榕设计研发完成,并于2025-01-24向国家知识产权局提交的专利申请。
本一种基于深度学习模型的创建结构化文档的方法在说明书摘要公布了:本发明提供一种基于深度学习模型的创建结构化文档的方法,涉及数据处理技术领域,所述方法包括:获取用户收集的基础文本信息,得到文本数据,通过对文本数据进行分片,得到文本分片数据,根据文本分片数据,对段落中句子的结构进行分析,确定句子中的关键词,分析段落中句子之间的逻辑关系,将段落中的句子关键词进行关联,分析章节中段落之间的关联度,识别章节的核心关键词,得到章节关键词数据集,分析文本所涉及到的领域,提取文本的领域信息,得到文本关键词数据集,基于图神经网络模型,构建结构化文档模型,将文本关键词数据集与文本数据输入至结构化文档模型,得到结构化文档。本发明能够通过深度学习模型构建结构化文档。
本发明授权一种基于深度学习模型的创建结构化文档的方法在权利要求书中公布了:1.一种基于深度学习模型的创建结构化文档的方法,其特征在于,所述方法包括:获取用户收集的基础文本信息,并对其进行预处理,将格式转换为统一格式,得到文本数据;通过对文本数据进行处理,按照章节和段落对其进行分片,得到文本分片数据;根据文本分片数据,对段落中句子的结构进行分析,确定句子中的关键词,得到句子关键词数据集;根据句子关键词数据集,分析段落中句子之间的逻辑关系,将段落中的句子关键词进行关联,得到段落关键词数据集;根据段落关键词数据集,分析章节中段落之间的关联度,识别章节的核心关键词,得到章节关键词数据集;根据章节关键词数据集,分析文本所涉及到的领域,提取文本的领域信息,得到文本关键词数据集;通过论文文献库获取结构化文本,并从中提取关键词,得到训练关键词集;基于图神经网络模型,构建初步结构化文档模型,并根据训练关键词集和结构化文本,对初步结构化文档模型进行训练,得到结构化文档模型;通过将文本数据与文本关键词数据集输入至结构化文档模型,确定文本数据之间语义关联,得到结构化文档。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人福建省鲸航网络科技有限公司,其通讯地址为:350000 福建省福州市鼓楼区软件大道89号福州软件园B区11号楼415、416室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。