买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中企知研(北京)科技有限公司
摘要:本申请提供了一种数字化服务资源优化存储方法及系统,该方法应用于分类计算机技术领域。该方法包括:获取政策数据的访问频率;基于访问频率对政策数据进行层次聚类,得到多层的聚类结果;基于多层的聚类结果和政策数据的频率类别标签,确定多层中的真实层和合并层;基于真实层和合并层,确定多个基分类器对合并层进行分类的类别识别能力;基于类别识别能力和合并层,对多个基分类器进行集成,得到集成分类器;响应于接收到的实时政策数据,采用集成分类器对所述实时政策数据进行分类并存储。在该方法中通过对政策数据的访问频率进行分类,将相近访问频率的政策数据放到同一片,能够提高缓存命中率和数据访问效率。
主权项:1.一种数字化服务资源优化存储方法,其特征在于,所述方法包括:获取政策数据的访问频率;基于所述访问频率对所述政策数据进行层次聚类,得到多层的聚类结果;基于所述多层的聚类结果和所述政策数据的频率类别标签,确定所述多层中的真实层和合并层;基于所述真实层和所述合并层,确定多个基分类器对所述合并层进行分类的类别识别能力;基于所述类别识别能力和所述合并层,对所述多个基分类器进行集成,得到集成分类器;响应于接收到的实时政策数据,采用所述集成分类器对所述实时政策数据进行分类并存储;所述频率类别标签的获取方法具体包括:基于所述访问频率,对所述政策数据进行多阈值分割,得到多个分割点,具体包括:获得每条政策数据的访问频率之后,统计得到所有数据的访问频率直方图;通过多阈值处理方法对该访问频率直方图进行分割,得到多个分割点;基于所述多个分割点中每相邻两个分割点内的频率值,确定多个类别的候选频率值,具体包括:将相邻两个分割点内的频率值作为一个类别的候选频率值,将该候选频率值对应的数据作为该类别的数据点,得到多个类别;基于每一类别的候选频率值与其他类别的候选频率值之间的差值,确定所述每一类别的频率类别标签,具体包括:其中,所述其他类别为所述多个类别中除所述每一类别之外的类别;计算每个类别中每个候选频率值与其它候选频率值的差值绝对值的和,将最小的求和结果对应的频率值作为该类别的类别频率值,将类别频率值作为每个类别中数据点的频率类别标签,得到多个类别和每个类别的频率类别标签;所述基于所述多层的聚类结果和所述政策数据的频率类别标签,确定所述多层中的真实层和合并层,包括:基于所述多层的聚类结果和所述频率类别标签,确定所述多层中每一层的分类误差;基于所述每一层的分类误差,在所述多层中确定所述真实层和所述合并层;所述基于所述多层的聚类结果和所述频率类别标签,确定所述多层中每一层的分类误差,包括:针对所述每一层中的每一节点类别,在所述频率类别标签中确定所述每一节点类别对应的多个实际类别;确定所述多个实际类别中每一实际类别的数据量,得到多个数据量;在所述多个数据量中,确定最大值与次最大值之间的比值;基于所述比值和所述多个实际类别的类别数,确定所述每一节点类别的分类误差;对所述每一层中的多个节点类别的分类误差进行均值化处理,得到所述每一层的分类误差;所述基于所述每一层的分类误差,在所述多层中确定所述真实层和所述合并层,包括:在所述多层中将分类误差最小的层确定为所述真实层;基于所述真实层,在所述多层中确定所述合并层。
全文数据:
权利要求:
百度查询: 中企知研(北京)科技有限公司 一种数字化服务资源优化存储方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。