买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:安徽工业大学;合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)
摘要:本发明提供一种差分隐私下加权滑动窗口的流式直方图发布方法及系统,涉及信息安全技术领域;本发明首先创建了一个新的草图结构,维护每个时间实例的每个直方图区间的计数信息;然后,本发明提出一种选择性发布机制,该机制利用每个直方图区间近似估计的区间计数值与噪声值之间的差异来选择更好的计数信息,并在加权滑动窗口中对所有的间隔计数采用贪婪分组,保证了大多数情况下查询数据的竞争性可用性。本发明可以快速处理基于加权滑动窗口的数据流,并在大多数情况下保证发布数据的竞争性可用性。
主权项:1.一种差分隐私下加权滑动窗口的流式直方图发布方法,其特征在于,包括:确定数据流中数据待发布的加噪直方图的区间;确定最优的隐私预算分配因子α,分配整体隐私预算ε为第一部分隐私预算αε和第二部分隐私预算ε1-α;对待发布的加噪直方图的每一个区间,构建近似估算草图结构对加权滑动窗口中的数据进行近似估计,获得所有区间的区间计数值;对待发布的加噪直方图添加第一隐私预算αε,分别获得每个区间的第一部分隐私预算噪声值;根据待发布的加噪直方图任一区间的区间计数值与其对应的第一部分隐私预算噪声值确定各区间的近似统计频数,根据各区间的近似统计频数构建当前时刻近似统计直方图;采用第二部分隐私预算ε1-α根据贪心聚类算法对当前时刻近似统计直方图排序后的区间进行聚类处理,获得当前时刻滑动窗口的加噪直方图;发布当前时刻滑动窗口的加噪直方图;所述构建近似估算草图结构对加权滑动窗口中的数据进行近似估计,获得区间计数值的过程为:判断进入加权滑动窗口数据流的当前数据是否符合待发布的加噪直方图判断统计的区间;若当前数据满足当前区间范围,当前数据置为1;若当前数据不满足当前区间范围,当前数据置为0;对加权滑动窗口分块,计算加权滑动窗口的近似误差阈值θ和当前时间戳的加权计数值y,计算公式分别为:y=y×γ+xt;其中,W表示滑动窗口的大小,γ表示加权因子,β表示近似误差因子,Si[t-W+1,t]表示第i个二进制数据流的滑动窗口,xt表示当前时刻滑动窗口Si[t-W+1,t]中的一个元素实例;判断数据流Si[t-W+1,t]在当前时间戳上是否有存在过期数据元素;计算当前时间戳的区间计数值当数据流Si[t-W+1,t]在当前时间戳上生成过期数据元素,则当数据流Si[t-W+1,t]在当前时间戳上没有过期数据元素,则其中,B表示一个用于存储加权滑动窗口计数信息的二维数组,其中,B1i表示第一个子数组、记录数据流中当前元素的时间戳,B2i表示第二个子数组、存储第i个二进制数据流Si[t-W+1,t]的区间计数值oldB1i表示最老块第一个子数组,oldB2i表示最老块第二个子数组;判断当前时间戳的区间计数值的大小,将区间计数值小于0的结果,全部置为0,获得当前加权滑动窗口内所有区间计数值
全文数据:
权利要求:
百度查询: 安徽工业大学 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种差分隐私下加权滑动窗口的流式直方图发布方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。