买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:泰山信息科技有限公司
摘要:本申请公开了一种UOT流式文档转换成OFD版式文档的方法,包括:读取UOT格式的流式文档并解析得到所述UOT格式的流式文档的各项数据;分类汇总所述UOT格式的流式文档的各项数据得到流式文档内存模型;将所述流式文档内存模型转换为版式文档内存模型;依照OFD格式规范将所述版式内存模型写出至磁盘,生成OFD格式的版式文档。该方法能够实现将UOT格式的流式文档转换为OFD格式的版式文档。本申请还公开了一种UOT流式文档转换成OFD版式文档的装置、设备及计算机可读存储介质,均具有上述技术效果。
主权项:1.一种UOT流式文档转换成OFD版式文档的方法,其特征在于,包括:读取UOT格式的流式文档并解析得到所述UOT格式的流式文档的各项数据;UOT结构采用多目录+多文件的结构存储文档;其中,目录包括根目录、元数据目录以及数据目录;根目录包括文档内容、图形内容、图像内容、样式、扩展信息;元数据目录包括应用级以及文档级的数据信息;数据目录存放外挂多媒体文件;通过图文排版引擎分类汇总所述UOT格式的流式文档的各项数据得到流式文档内存模型;流式文档内存模型表现为内存中的多个流式内存对象;将所述流式文档内存模型转换为版式文档内存模型;依照OFD格式规范将所述版式文档内存模型写出至磁盘,生成OFD格式的版式文档;OFD结构采用容器+文档的方式描述与存储数据;容器是虚拟的存储系统,将各类数据描述文件聚合起来,并提供相应的访问接口和数据压缩方法;文档包括虚拟存储系统、文档模型以及页面内容;其中,虚拟存储系统包括包组织结构以及包内目录结构;文档模型包括文档、页面、大纲、文件级资源;页面内容包括页面级资源、文本、图形、图像;所述将所述流式文档内存模型转换为版式文档内存模型,包括:以文档为单位,依据所述流式文档内存模型的各流式内存对象构建文档树结构;遍历所述文档树结构,基于流式文档模型中各流式内存对象的数据计算得到版式内存对象在容器中的坐标值,以及所使用到的字符集、字型、图元信息、资源,并以页为单位,抽取所述流式内存对象中的数据构建版式文档内存模型;计算版式内存对象的坐标值的方式包括:页面空间规定页面的左上角为原点,X轴向右增长,Y轴向下增长;根据原点平移、轴方向变换、坐标数值变换完成到设备空间的变换;其中,坐标数值变换是将图元的长度数据通过设备的分辨率和其他信息转换成设备中的像素长度;变换矩阵提供了两个坐标之间的变换规则,用一个长度为6的一维数组描述;所述读取UOT格式的流式文档并解析得到所述UOT格式的流式文档的各项数据,包括:通过流式解析引擎,采用解压技术将磁盘中的UOT流式文档的物理文件解压到内存中,并采用XML解析技术,将UOT流式文档包结构中的各部分数据读取到文件流中保存;所述依照OFD格式规范将所述版式文档内存模型写出至磁盘,生成OFD格式的版式文档,包括:根据OFD格式的版式文档的规范创建空白的XML文件;将所述版式文档内存模型的各版式内存对象写出到相应的所述XML文件;将所述XML文件组织到电子文件物理包中,并进行打包压缩,得到所述OFD格式的版式文档;所述进行打包压缩包括:通过Zip压缩方法与Deflate压缩方法进行打包压缩。
全文数据:
权利要求:
百度查询: 泰山信息科技有限公司 一种UOT流式文档转换成OFD版式文档的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。