Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种多层级数据节点存储索引方法和系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州新视窗信息技术有限公司

摘要:本发明提出了一种多层级数据节点存储索引方法和系统。其中,所述方法包括:预测数据节点在未来时间段被查询频率;根据预测的数据节点被查询的频率、最近访问时间和总的访问频率计算数据节点的得分,根据得分将数据节点划分为内存数据节点和外存数据节点,根据存放在内存还是外存建立全局索引,通过此方法和对应的系统,可以实现高效的数据节点管理和查找,优化内存和外存的资源利用,提高查询系统的整体性能。

主权项:1.一种多层级数据节点存储索引方法,其特征在于,所述方法包括:预测数据节点在未来时间段被查询频率;根据预测的数据节点被查询的频率、最近访问时间和总的访问频率计算数据节点的得分,根据得分将数据节点划分为内存数据节点和外存数据节点,根据存放在内存还是外存建立全局索引;其中,所述预测数据节点在未来时间段被查询频率,包括:收集关于数据节点被查询的历史记录,所述历史记录包括查询的时间戳、查询类型和数据节点的标识符,所述查询类型包括对数据节点的读取、更新和删除;在所述历史记录中加入季节性活动、特殊事件和紧急事件信息,这些信息标记为二进制特征,某一天有特殊事件,该特征为1,否则为0;从所述查询的时间戳中提取日期特征,所述日期特征包括月份、星期几和小时,从所述日期特征中创建新的衍生变量,所述新的衍生变量包括从上一次查询时间到当前查询时间的间隔;将所述历史记录、季节性活动信息、特殊事件信息、紧急事件信息、日期特征和衍生变量构建成数据集;处理数据集中的数据的缺失值、异常值,以及对数据进行标准化处理;将数据集分为训练集和测试集,80%的数据作为训练集,剩余20%作为测试集;在训练集上训练随机森林模型,并使用交叉验证来优化模型参数和避免过拟合;生成包含未来时间段的特征数据集,所述特征数据集包括日期特征、季节性和事件特征以及历史特征,所述日期特征为生成未来时间段的日期,并提取未来时间段的日期特征,所述季节性和时间特征为根据预期,标记未来时间段的特殊事件和季节性活动,所述历史特征为以过去时间段的数据的查询次数为特征;使用训练好的随机森林模型对包含未来时间段的特征数据集进行预测;将随机森林模型输出的查询概率转换为查询频率。

全文数据:

权利要求:

百度查询: 杭州新视窗信息技术有限公司 一种多层级数据节点存储索引方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。