深圳市网旭科技有限公司李乐乐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市网旭科技有限公司申请的专利文档转换方法及装置、计算机可读存储介质、计算机设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115510821B 。
龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211332538.3,技术领域涉及:G06F40/166;该发明授权文档转换方法及装置、计算机可读存储介质、计算机设备是由李乐乐;刘海林设计研发完成,并于2022-10-28向国家知识产权局提交的专利申请。
本文档转换方法及装置、计算机可读存储介质、计算机设备在说明书摘要公布了:本申请提供一种文档转换方法,包括逐页解析第一文档获得所述第一文档的每页内容的所有元素,每一元素具有位置和内容;将每页内容的所有元素对应映射于每一预设页面;根据在所述每一预设页面中各元素的位置和内容构建出若干文本块和或若干形状块;按照预设的布局规则确定出每个文本块和或每个形状块在每一预设页面中的分节和分栏;根据布局好所有元素的每个预设页面生成第二文档。本申请通过对第一文档的每页内容的所有元素按照内容编排添加布局,文档转换前后的各元素的位置基本一致,提升了还原度。此外,本申请还提供一种应用所述文档转换方法的装置、计算机可读存储介质以及计算机设备。
本发明授权文档转换方法及装置、计算机可读存储介质、计算机设备在权利要求书中公布了:1.一种文档转换方法,文档转换方法用于将不可编辑的第一文档转换为可编辑的第二文档,其特征在于,所述文档转换方法包括: 逐页解析第一文档获得所述第一文档每页内容的所有元素,每一元素具有位置和内容; 将每页内容的所有元素对应映射于每一预设页面,使所述每一预设页面包含第一文档中对应页的所有元素; 根据在所述每一预设页面中各元素的位置和内容构建出若干文本块和或若干形状块; 按照预设的布局规则确定出每个文本块和或每个形状块在每一预设页面中的分节和分栏,得到每页内容的所有元素在对应的预设页面中的布局,使预设页面中的每个元素带上布局属性,所述布局属性包括行、分节、分栏;所述第一文档的元素并未具有布局属性;以及 根据布局好所有元素的每个预设页面生成第二文档,所述第二文档每页的元素布局与对应的预设页面的元素布局相同; 其中,所述按照预设的布局规则确定出每个文本块和或每个形状块在每一预设页面中的分节和分栏为:先确定出每个文本块和或每个形状块在每一预设页面中的分节,后确定出每个文本块和或每个形状块的分栏;具体包括: 逐行检测每一行的分栏数量; 当一行的分栏数量与所述行的前一行的分栏数量不同,将所述行与所述行的前一行分在不同的分节中; 当一行的分栏数量与所述行的前一行的分栏数量相同,将所述行与所述行的前一行分在同一分节中; 其中,所述形状块包括表格形状块;根据在所述每一预设页面中各元素的位置和内容构建出若干形状块包括: 检测是否存在一组或者多组相交的边框线,每一边框线对应一个元素; 若存在多组相交的边框线,将所述多组相交的边框线所对应区域确定为潜在显式表格区域得到一个形状块的区域信息; 根据所述一组或者多组相交的边框线确定出所述潜在显式表格区域的表格结构得到一个或者多个单元格; 将所述单元格所对应的区域确认为各单元格的区域信息; 根据形状块的区域信息、各单元格的区域信息、各边框线对应的元素得到对应的显性表格形状块。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市网旭科技有限公司,其通讯地址为:518000 广东省深圳市南山区南山街道南海大道2163号来福士广场办公楼11楼1101室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励