首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种指定文本用对象分布式展示系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:盟浪可持续数字科技(深圳)有限责任公司

摘要:本发明公开了一种指定文本用对象分布式展示系统,涉及电子文件处理技术领域,包括文本处理模块、文本分配模块和索引构建模块;文本处理模块用于将PDF文件拆分成多个单页文件,并将PDF页文件分布式存储于多个存储终端中;文本分配模块用于获取PDF页文件的访问数据并进行访问系数分析,并根据访问系数将PDF页文件分配至对应的存储终端存储;索引构建模块用于建立一个PDF页索引文件,记录PDF页文件存储位置,当用户进行访问时,首先读取页级索引,然后通过页级索引定位单页文件进行快速读取,当多用户同时访问PDF不同页时,能够分散存储终端进行读取,提高读取带宽,做到高并发访问,提高热点PDF页文件的访问效率。

主权项:1.一种指定文本用对象分布式展示系统,其特征在于,包括文本上传模块、云平台、文本处理模块、存储模块、数据库、文本分配模块、索引构建模块以及终端分析模块;所述文本上传模块用于管理人员上传PDF文件,并将PDF文件发送至云平台;所述云平台用于将接收到的PDF文件传输至文本处理模块;所述文本处理模块用于对PDF文件进行拆分,将PDF文件分成多个单页文件,记为PDF页文件;然后将PDF页文件分布式存储于多个存储终端中,其中每个PDF页文件均有唯一编号;所述存储模块包含若干个存储终端,所述文本分配模块与文本处理模块相连接,用于获取PDF页文件的访问数据并进行访问系数分析,然后根据访问系数FZ依次将PDF页文件分配至对应的存储终端存储;所述文本分配模块的具体分配步骤为:将PDF页文件按照访问系数FZ的大小进行降序排列;获取排序第一的PDF页文件,选取存配值CP最大的存储终端标记为选中终端;将排序第一的PDF页文件标记为已分配文件,再获取排序第二的PDF页文件,并选取存配值CP次之的存储终端标记为选中终端,以此类推;选中终端对PDF页文件进行存储;其中,所述访问系数FZ的具体分析过程如下:针对某个PDF页文件,采集该PDF页文件预设时间段内的访问数据;统计PDF页文件的访问频率标记为P1;将每次访问时的访问时长标记为Ti,设定对应访问过程中的转换值为ZHi;利用公式FWi=Ti×g1+ZHi×g2计算得到访问值FWi,其中g1、g2为系数因子,i表示第i次访问;将访问值FWi与访问阈值相比较;统计FWi大于访问阈值的次数占比为Zb1;当FWi大于访问阈值时,获取FWi与访问阈值的差值并求和得到超访值G1;利用公式GZ=Zb1×k1+G1×k2计算得到超访系数GZ,其中k1、k2为系数因子;利用公式FZ=P1×k3+GZ×k4计算得到对应PDF页文件的访问系数FZ,其中k3、k4为系数因子;选中终端对PDF页文件进行存储,并将对应的存储地址和PDF页文件编号返回至索引构建模块对PDF页索引文件进行构建;当用户进行访问时,首先读取页级索引,然后通过页级索引定位单页文件进行快速读取;所述终端分析模块用于对存储终端进行存配值CP分析,并将存配值CP打上时间戳并存储至云平台;具体分析步骤为:获取每个存储终端在当前时刻下的访问节点连接数为Lt,设定对应存储终端接入访问节点的最大容量为L0,最小容量为L1;利用公式Lg=L0-LtLt-L1计算得到该存储终端的接入系数Lg;设定存储终端的剩余内存量为Nt;将存储终端的实时网络访问速度标记为Ft,建立实时网络访问速度Ft随时间变化的曲线图,并标记为网速曲线图;将实时网络访问速度Ft与标准网速阈值相比较;若Ft≤标准网速阈值,则在对应的曲线图中截取对应的曲线段并标注为红色,记为低速曲线段;统计低速曲线段的数量为Q1,将所有的低速曲线段对时间进行积分并求和得到低速参考能量Q2,利用DS=Q1×g3+Q2×g4计算得到当前存储终端的低速系数DS,其中g3、g4为系数因子;利用公式CP=Lg×g5+Nt×g6+Ft×g7DS×g8计算得到存储终端的存配值CP,其中g5、g6、g7、g8为系数因子。

全文数据:

权利要求:

百度查询: 盟浪可持续数字科技(深圳)有限责任公司 一种指定文本用对象分布式展示系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。