Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华院计算技术(上海)股份有限公司夏天获国家专利权

华院计算技术(上海)股份有限公司夏天获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华院计算技术(上海)股份有限公司申请的专利一种基于结构分析的文档内容解析方法、装置和程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120805892B

龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511287239.6,技术领域涉及:G06F40/205;该发明授权一种基于结构分析的文档内容解析方法、装置和程序产品是由夏天;虞钉钉;徐清;王浩然;曹培;沈旭立;赵爽;李涵文;张泰宇;张逸雯;白琪设计研发完成,并于2025-09-09向国家知识产权局提交的专利申请。

一种基于结构分析的文档内容解析方法、装置和程序产品在说明书摘要公布了:本发明提供一种基于结构分析的文档内容解析方法、装置和程序产品,涉及文档智能处理技术领域。其中,文档内容解析方法包括:对XML文档进行编号预解析与样式预解析;处理XML文档的主文档文件,按照XML文档中定义的自然顺序逐一读取块级元素,将元素分发至相应的专门化解析子模块;使用专门化内容解析子模块,分别对XML文档进行深度解析与结构重构,生成Markdown格式文档;在整个解析流程中,同步地对XML文档进行嵌入式资源处理。本发明实现对复杂文档的高精度、高效率和低资源消耗的结构化转换,尤其适用于对采用OfficeOpenXML标准的字处理文档进行高保真度的内容提取与结构重构。

本发明授权一种基于结构分析的文档内容解析方法、装置和程序产品在权利要求书中公布了:1.一种基于结构分析的文档内容解析方法,其特征在于,包括以下步骤: S1:对XML文档进行编号预解析与样式预解析,提取文档的全局结构与格式化规则; S2:处理XML文档的主文档文件,对其中的内容主体进行序列化遍历,按照XML文档中定义的自然顺序逐一读取块级元素,通过元素的XML标签对其进行类型判断,之后将元素分发至相应的专门化解析子模块; S3:使用专门化内容解析子模块,分别对XML文档中的目录、段落与列表以及表格进行深度解析与结构重构,生成Markdown格式文档;其中, 对段落与列表的处理方式包括采用分层级计数的状态机维护全局的列表上下文, 对表格进行处理的方式包括:构建与表格结构一致的二维逻辑矩阵,再向其中填充表格内容; S4:在整个解析流程中,同步地对XML文档进行嵌入式资源处理。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华院计算技术(上海)股份有限公司,其通讯地址为:201210 上海市浦东新区中科路1750号1幢23层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。