Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 抖音视界有限公司邹开发获国家专利权

抖音视界有限公司邹开发获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉抖音视界有限公司申请的专利文档格式转换方法、装置、存储介质及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115114481B

龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210651509.7,技术领域涉及:G06F16/84;该发明授权文档格式转换方法、装置、存储介质及设备是由邹开发设计研发完成,并于2022-06-09向国家知识产权局提交的专利申请。

文档格式转换方法、装置、存储介质及设备在说明书摘要公布了:本申请公开一种文档格式转换方法、装置、存储介质及设备,该方法包括:识别PDF文档中的表格,表格包括全框表格、半框表格、无框表格中的至少一种;识别PDF文档中的图表,图表至少包括以图形方式显示的内容信息;根据表格与图表,将PDF文档转换为HTML文档,其中,HTML文档中转换出的表格为HTML形式,以及HTML文档中转换出的图表为图片形式。本申请实施例可以有效识别PDF文档中的如全框表格、半框表格、无框表格、图表等各个元素,并转换为HTML文档,提升了PDF文档解析格式转换的准确率。

本发明授权文档格式转换方法、装置、存储介质及设备在权利要求书中公布了:1.一种文档格式转换方法,其特征在于,所述方法包括: 识别PDF文档中的表格,所述表格包括全框表格、半框表格、无框表格中的至少一种; 识别所述PDF文档中的图表,所述图表至少包括以图形方式显示的内容信息; 根据所述表格与所述图表,将所述PDF文档转换为HTML文档,其中,所述HTML文档中转换出的所述表格为HTML形式,以及所述HTML文档中转换出的所述图表为图片形式; 其中,所述识别PDF文档中的表格,包括:基于所述PDF文档中的线条对表格进行定位,以识别所述PDF文档中的第一表格,所述第一表格包括所述全框表格与所述半框表格中的至少一种,具体的: 识别所述PDF文档中的文本、线条、每个所述线条的坐标、以及每两个所述线条之间的宽度和高度,其中,所述线条包括水平线条和垂直线条; 根据所述线条中的所有水平线条的坐标,以及每两个所述水平线条之间的宽度,确定出所述水平线条中两两平行、且长度相近或相同的多组水平线条组,其中,每组所述水平线条组包含两个相互平行、且长度相近或相同的两个所述水平线条; 初始化第一表格集合,对于所述多组水平线条组中的每组水平线条组,分别从上到下和从下到上遍历所述多组水平线条组中的每个水平线条进行表格识别处理,并将所述表格识别处理过程中识别到的所有第一表格加入所述第一表格集合,包括:对于所述多组水平线条组中的每组水平线条组,分别从上到下和从下到上遍历水平线条组中的每个水平线条;判断当前线条是否是最后一个线条;若所述当前线条不是最后一个线条,则判断所述当前线条和所述当前线条之后的第一个线条之间是否满足第一条件,其中,所述第一条件为所述当前线条和所述当前线条之后的第一个线条之间存在文本、且文本之间有空白分隔、以及文本和线条间的距离小于第二阈值;若所述当前线条和所述当前线条之后的第一个线条之间满足第一条件,则将所述当前线条和所述当前线条之后的第一个线条构成一个新的第一表格;判断所述当前线条是否是倒数第二个线条;若所述当前线条是倒数第二个线条,则结束遍历流程。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人抖音视界有限公司,其通讯地址为:100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。