中国人民大学魏哲巍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民大学申请的专利一种在分布式环境下元素的估计方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115329000B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210965052.7,技术领域涉及:G06F16/27;该发明授权一种在分布式环境下元素的估计方法及装置是由魏哲巍;李家郡;丁博麟;路璐;戴谢宁设计研发完成,并于2022-08-12向国家知识产权局提交的专利申请。
本一种在分布式环境下元素的估计方法及装置在说明书摘要公布了:本发明公开了一种在分布式环境下元素的估计方法及装置,所述方法包括:从每个节点中分别提取一样本;所述节点为分布式数据库;对每个所述样本进行频率统计以获得数据字典;在每个所述节点上维护至少两个数据摘要,所述数据摘要包括基于所述数据字典获取的数据频率特征;所述数据频率特征表征所述样本中元素的特征;将每个所述节点中的所述数据摘要发送至主节点,由所述主节点合并所有节点中的数据摘要以获得第一数据摘要并基于所述第一数据摘要对所述元素进行估计能够避免在分布式环境下数据规模过大,机器之间通信代价过大的问题,从而提高在分布式环境下估计元素个数的效率。
本发明授权一种在分布式环境下元素的估计方法及装置在权利要求书中公布了:1.一种在分布式环境下元素的估计方法,其特征在于,所述方法包括: 从每个节点中分别提取一样本;所述节点为分布式数据库; 对每个所述样本进行频率统计以获得数据字典; 在每个所述节点上维护至少两个数据摘要,所述数据摘要包括基于所述数据字典获取的数据频率特征;所述数据频率特征表征所述样本中元素的特征; 将每个所述节点中的所述数据摘要发送至主节点,由所述主节点将接收的所有同类型的数据摘要进行合并操作,所述合并操作是将两个同类型的数据摘要合并,合并后的数据摘要融合了两者的信息以获得第一数据摘要,并基于所述第一数据摘要执行估计操作; 其中,所述估计操作具体为:所述主节点基于所述第一数据摘要,获取样本中不同元素个数的估计值作为数据整合信息,并获取各节点中仅在本地样本中出现一次的元素个数的估计值作为低频信息;利用所述数据整合信息与所述低频信息对所述元素进行估计; 其中,根据样本中不同元素个数和只出现一次元素个数进行估计,公式如下: ; 其中,代表保证估计误差的不同元素个数估计量,q为采样率,为样本中出现总次数为i的元素个数; 其中,对只出现一次元素个数进行估计具体包括: 获取除节点i之外的所有其他节点的数据频率特征为数据整合信息的数据摘要; 将所述其他节点的数据整合信息的数据摘要合并,形成第二数据摘要,并基于所述第二数据摘要获取第二估计值,所述第二估计值表示在所述其他节点中出现过的元素个数的估计值; 将节点i的数据频率特征为低频信息的数据摘要与所述第二数据摘要合并,形成第三数据摘要,并基于所述第三数据摘要获取第三估计值; 计算所述第三估计值与所述第二估计值的差值,得到节点i上数据频率特征为低频信息的元素个数的估计值; 将针对所有节点分别得到的所述估计值进行求和,得到在整个分布式环境下只出现过一次的元素个数的估计值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民大学,其通讯地址为:100872 北京市海淀区中关村大街59号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励