买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:大连炳希慧利网络科技有限公司
摘要:本发明涉及数据检索技术领域,具体为云端信息检索加速系统,系统包括:数据流熵计算模块接收数据流,记录每个数据包的值和发生频次,对记录的数据执行信息熵值计算,量化数据流的不确定性,生成信息熵特征值。本发明中,通过对数据流的不确定性进行量化并据此分配索引路径,显著优化了查询处理的效率和精确性,信息熵的引入作为数据流复杂度的衡量,提供了一个创新的方法来优化索引结构,使得系统能够精准处理各种复杂查询,动态调整索引配置应对数据和查询模式的变化,显著提升了系统的适应性和灵活性,此外,根据系统负载和数据访问模式的智能选择处理节点的策略进一步降低了响应时间,增强了并发处理能力。
主权项:1.云端信息检索加速系统,其特征在于,所述系统包括:数据流熵计算模块接收数据流,记录每个数据包的值和发生频次,对记录的数据执行信息熵值计算,量化数据流的不确定性,生成信息熵特征值;所述信息熵特征值的获取步骤具体为:接收数据流,并对每种数据包类型进行计数,记录数据包的出现次数,采用公式:;计算每种数据包i在时间窗T内的加权累积出现次数,生成每种数据包的加权发生频次;其中,代表目标数据包类型i的加权累积出现次数,是数据包i的权重,表示在时间t数据包i是否出现的指示函数,T为监控时间窗口;将全部所述数据包类型的发生频次汇总,计算总发生频次,采用公式: ;合计全部类型数据包的累积发生频次,获取总数据包发生频次;其中,N为全部数据包类型发生频次的总和,n1是数据包的种类数;基于所述数据包的加权发生频次和所述总数据包发生频次,评估数据流的不确定性,采用公式: ;标准化信息熵值以比较差异化数据流,得到数据包的信息熵特征值;其中,n2代表差异化数据包类型的数量,是以2为底的对数函数,H表示数据流的信息熵,量化数据流的不确定性;数据预分类索引模块基于所述信息熵特征值,根据数据复杂度的量化级别,分配数据流至对应的索引路径,适用倒排索引处理复合查询,基础查询通过多级B树索引处理,生成索引分配记录;索引动态调整模块监控数据更新频率和查询模式的变化,结合所述索引分配记录,对索引配置进行调整,调整动作包括数据类别迁移和索引类型变更,匹配查询需求的演变,生成索引调整日志;查询路由优化模块分析即时查询请求,根据数据访问模式和系统当前负载情况,选定处理查询的数据节点,利用所述索引调整日志调整查询路径,生成优化查询路由。
全文数据:
权利要求:
百度查询: 大连炳希慧利网络科技有限公司 云端信息检索加速系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。