一种基于规模化词典大数据的分布式管理方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：万邦同和(北京)信息技术有限公司

摘要：本发明公开一种基于规模化词典大数据的分布式管理方法，涉及计算机技术领域，所述方法包括：将分布式架构的各项节点数据以及词典数据维护到管理系统中；管理系统根据存储需求这一条件对词典数据和存储节点进行分配；基于存储节点的分配结果进行检索测试，并采集检索测试过程中不同检索命令的计算资源需求；管理系统基于计算资源需求这一条件对检索命令和计算节点进行分配。采用分布式智能管理系统，改进词典应用的运行环境，从而提高词典应用的检索速率。

主权项：1.一种基于规模化词典大数据的分布式管理方法，包括：Step1、将分布式架构的各项节点数据以及词典数据维护到管理系统中；Step2、管理系统根据存储需求这一条件对词典数据和存储节点进行分配；Step3、基于存储节点的分配结果进行检索测试，并采集检索测试过程中不同检索命令的计算资源需求；Step4、管理系统基于计算资源需求这一条件对检索命令和计算节点进行分配；根据存储需求这一条件对词典数据和存储节点进行分配，具体包括以下子步骤：将分布式架构的各存储节点作为待分配节点，并查询出各存储节点的存储资源数据作为待分配节点的附加属性；将待分配节点存储于一个临时的数据集中，表示为，其中分别表示不同待分配节点的编码，分别表示不同待分配节点的附加属性，n为分布式架构中存储节点的个数；将词典数据划分为若干数据包，并以唯一编码以及数据包大小进行标注作为待分配元素；待分配元素存储在一个队列中，表示为，其中分别表示数据包编码，分别为数据包的大小，m为划分后数据包的个数；以存储需求为分配条件，将待分配元素基于一次分配函数自动分配给待分配节点；一次分配函数表示为：，其中表示集合中下标为i的节点编号，表示集合中下标为i+1的节点编号，表示队列中下标为j的数据包编码，C为计数器，表示集合中下标为i的节点附加属性，表示队列中下标为j数据包大小，i、j初始值为1，C初始值为0，当条件成立时，则返回键值对，接着执行，来更新j与C的值，当条件成立时，则返回键值对，再执行，来更新C、j以及i的值，直至j=m或i=n时退出函数，函数返回值存储于数据集中；若退出函数时j大于等于m且i小于等于n，则说明待分配元素以完成分配，若退出函数时，i大于n且j大于m，则说明所有存储节点的存储资源都已用尽，若待分配元素还有未完成分配的，则增加存储节点或扩展现有存储节点的存储资源；检索测试的具体步骤为：将存储节点的分配结果实施到词典应用的运行环境；每次随机选择一个计算节点作为检索命令的执行节点，反复执行不同的检索命令；采集各个计算节点实时的计算资源消耗情况并整理为数据集；具体地，将数据集中存储节点与数据包的对应关系实施到词典的运行环境，每次检索随机选择一个计算节点作为检索命令的执行节点，基于这个运行环境进行检索测试，反复执行不同的检索命令，采集各个计算节点实时的计算资源消耗情况并整理为数据集，表示为：，其中分别表示不同的检索命令，表示执行节点编码，取值1~q，q为分布式架构中计算节点的总个数，分别表示不同检索命令执行时各节点计算资源的消耗数据集，，分别表示不同计算资源数据项，为资源数据项总个数，分别表示不同检索命令下的响应时间，分别表示不同检索命令的检索结果标识，1为检索成功，0为检索失败，z为检索命令的执行数量；基于计算资源需求这一条件对检索命令和计算节点进行分配，具体包括以下子步骤：提取计算资源数据项与检索命令的第一关联特征；第一关联特征提取函数为：，将P3数据集中的数组元素依次作为传参E进行特征提取，为第o项计算资源数据项的值，o取值，为资源数据项总个数，为第o项计算资源数据项的最大值，rt为输入的数组元素中的响应时间；将函数返回值添加到数据集P3，表示为，分别表示不同检索命令与计算节点第一关联特征；基于第一关联特征提取计算资源数据项与检索命令的第二关联特征；第二关联特征提取函数为：，将P3数据集中的数组元素依次作为传参E进行特征提取，其中为第o项计算资源数据项的值，o取值，为资源数据项总个数，为第o项计算资源数据项的最大值，rt为输入的数组元素中的响应时间，为P3数据集中所有响应时间的平均值，h为输入的数组元素中的检索结果标识，f为输入的数组元素中的第一关联特征；将提取完成的第二关联特征整理为数据集，表示为，分别表示不同的检索命令，分别表示不同的第二关联特征，z为检索命令的执行数量；基于第二关联特征设计二次分配函数，并基于二次分配函数对检索命令与计算节点进行分配；根据需要执行的检索命令从P4数据集中获取对应的第二关联特征，作为传参输入至二次分配函数，由二次分配函数给检索命令分配一个计算节点作为该命令的执行节点，具体地：二次分配函数表示为：，其中x为检索命令转化的向量，u为该检索命令与计算节点的第二关联特征，为第个计算节点的资源总余量，取值1~q，q为计算节点的总个数；返回求和项计算结果为最小时的，则选取下标为的计算节点作为检索命令的执行节点。

全文数据：

权利要求：

百度查询：万邦同和(北京)信息技术有限公司一种基于规模化词典大数据的分布式管理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种建筑施工支架

下一篇：一种双向调节的船体除锈装置

相关技术

一种建筑施工支架

一种双向调节的船体除锈装置

一种网线光纤复合线

一种掺氢燃气轮机用缸体

一种太阳能LED投光灯

一种空调柜机接线结构及空调器

一种高强度双层防护头盔

一种城市轨道交通直流设备绝缘安装结构

一种星载TR组件功放芯片自动共晶焊接装置

一种便于安装的全封闭公路声屏障

油烟处理设备

一种折叠线盘

数据相关技术

数据生成装置、程序、数据接收装置和数据结构_索尼半导体解决方案公司_202380028143.0

数据发送装置、数据接收装置、以及数据传输系统和方法_北京霍里思特科技有限公司_202411144409.0

监测数据采集终端及监测数据采集系统_北京市轨道交通建设管理有限公司_202410904277.0

基于数据中台的数据统合管理方法_北京南天智联信息科技股份有限公司_202411297284.5

数据凭证生成和业务数据还原方法及系统_贵州财经大学_202411141221.0

数据存储装置与数据处理方法_慧荣科技股份有限公司_202010484223.5

压缩固件数据_美光科技公司_202280090626.9

医疗数据组装系统_生命奇点(北京)科技有限公司_202410416859.4

点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法_LG电子株式会社_202080070476.6

一种基于关系型数据库的数据质量问题数据存储方法_浪潮软件科技有限公司_202411087926.9

管理相关技术

基于云管理的智能网关管理平台及方法_杭州领祺科技有限公司_202411040653.2

药品管理装置和药品管理方法_香港大学深圳医院_202410801711.2

车辆热管理系统_中国重汽集团济南动力有限公司_202411064167.4

知识管理平台_广州市泺立能源科技有限公司_202411105073.7

电池管理设备及方法_株式会社LG新能源_202280093847.1

燃料元件监造管理系统_华能山东石岛湾核电有限公司_202411005581.8

车辆的热管理组件_萨乐锐伊塔洛工业有限公司_202080064234.6

存储管理装置、存储管理方法、处理器和计算机系统_阿里巴巴集团控股有限公司_201910907572.0

热管理系统的制冷量不足故障诊断方法及其热管理系统_东莞市深合电气有限公司_202411044406.X

一种分析管理单元、光伏电站交互式管理系统_上海思格源智能科技有限公司_202410536667.7

方法相关技术

核分类方法、映射方法、数据传输方法及装置、芯片_北京灵汐科技有限公司_202110303317.2

模型压缩方法、训练方法、多媒体数据处理方法及装置_北京百度网讯科技有限公司_202311235188.3

温升预测模型训练方法、预测方法及控制方法_浙江吉利控股集团有限公司_202410908685.3

对准装置及方法、成膜装置及方法和电子器件的制造方法_佳能特机株式会社_202410495098.6

集成电路的制造方法、设计方法以及备用单元的设计方法_台湾积体电路制造股份有限公司_202410679429.1

图像编码/解码方法和图像数据的传输方法_LX半导体科技有限公司_202411317979.5

资源循环方法及资源循环管理方法_株式会社久保田_202380019741.1

包裹拉距方法及包裹分拣方法_苏州金峰物流设备有限公司_202410973216.X

数据更新方法、信息推送方法及装置_支付宝(杭州)信息技术有限公司_202410852906.X

学习装置、检查装置、学习方法以及检查方法_株式会社斯库林集团_202010947201.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于规模化词典大数据的分布式管理方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务