首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种隐私保护的数据流统计发布方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华南师范大学

摘要:本发明公开一种隐私保护的数据流统计发布方法,应用于数据流中的统计数据发布。该方法包括:利用固定大小的滑动窗口对数据流选取一定时间长度的数据,实时计算前一个发布与当前时刻的数据点的差异度;自适应地循环分配隐私预算,确定直方图的发布方式;使用轮盘赌选择排序算法,对当前时刻的数据进行排序,得到排序后的直方图数据;对排序后的直方图数据进行基于贪心思想聚类划分操作,得到多个分组;对得到的多个分组进行均值替代后添加噪声,发布对应的加噪直方图。本发明通过将轮盘赌选择与贪心聚类分组方法结合对直方图数据进行快速精确的排序分组,降低直方图数据的发布误差,有效保证数据流发布的数据可用性。

主权项:1.一种隐私保护的数据流统计发布方法,其特征在于,包括以下步骤:步骤一:利用固定大小的滑动窗口对数据流选取一定时间长度的数据,实时计算前一个发布与当前时刻的数据点的差异度;具体为:给定一个无限生成的数据流表示为T={D1,D2,...,Di-1,Di,...},其中,数据点Di表示为在时间区间[i-1,i下,数据流中所有用户发生事件xi1、xi2、...、xid的记录的统计数序列,Di={xi1,xi2,...,xid},其中,xij,j=1,2,...d为数据流在第i个时间戳下,发生了事件xj的记录{xj=1,0,...,0}的频数,对于任意时间戳i,激活一个w时间长度的滑动窗口覆盖i-w+1到i时间戳上的数据集,截选部分数据Tw={Di-w+1,Di-w+2,...,Di};实时计算前一个发布与当前时刻的数据点的差异度其计算方式为:其中,表示在时间戳i-1下发布的加噪直方图对应的数据,是指i-1时刻发布的加噪直方图中的事件k的桶计数;步骤二:自适应地循环分配隐私预算,确定直方图的发布方式;具体为:计算数据点Di的待分配隐私预算εi,若当前时刻i小于窗口长度w,令否则,其中,ε代表总的隐私预算,εk为k时刻发布的数据点已分配的预算大小;将前一个发布与当前时刻的数据点的差异度与待添加的噪声规模比较大小,如果差异度小于待添加的噪声规模,用前一个发布的直方图作为当前时刻数据点的发布,不分配隐私预算;如果差异度大于待添加的噪声规模,给当前时刻的数据点分配隐私预算εi,用于后续发布,其中,待添加的噪声是指服从拉普拉斯分布的随机变量SF为全局敏感度,噪声规模是指它的方差步骤三:使用轮盘赌选择排序算法,对当前时刻的数据进行排序,得到排序后的直方图数据;具体为:轮盘赌选择排序算法包括以下步骤:3.1.将待发布的数据点转换为对应的直方图,从直方图中选择最小的桶计数ht作为选择条件,初始化一个空的排序队列,将ht从直方图中移除后加入到排序队列中;3.2.根据给出的选择条件,计算直方图中剩余桶计数的适应度;3.3.计算直方图中每个桶计数的选择概率和累计概率,然后用轮盘赌选择方法从中选择出一个桶计数hj,作为选择条件ht的下一个取值,将hj从直方图中移除后加入到排序队列的末端,更新选择条件的值为桶计数hj,即令ht=hj;3.4.重复执行步骤3.2和步骤3.3,直至直方图为空集,得到所述排序队列即为排序后的直方图数据;步骤四:对所述排序后的直方图数据进行基于贪心思想的聚类划分操作,得到多个分组;步骤五:对得到的多个分组进行均值替代后添加噪声,发布对应的加噪直方图。

全文数据:

权利要求:

百度查询: 华南师范大学 一种隐私保护的数据流统计发布方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。