买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于云端的保护交集样本ID的多方特征数据对齐方法,涉及机器学习技术领域,设计了一种基于云端的PSI拓展协议,该协议分为3个阶段:数据外包、特征数据对齐联合和PPML,其中我们主要关注前2个阶段。在数据外包阶段,各方将各自拥有的特征数据加密后上传至云服务端,当某一方数据请求方需要联合其他方的特征数据进行模型训练时,它只需要告诉云端它想联合的参与方的ID,接下来云端会与它进行特征数据对齐的协议,协议的输出是它与其他参与方交集用户联合后特征数据的一份秘密共享,另一份秘密共享由云端掌握,然后数据请求方可以和云端执行一个基于秘密共享的PPML协议进行模型的训练。
主权项:1.一种基于云端的保护交集样本ID的多方特征数据对齐方法,其特征在于,包括以下步骤:步骤1:从PSI拓展协议中选择一个数据持有方作为“带头人”生成公共参数和秘密参数,将秘密参数发送至其余的数据持有方,并将公共参数广播至其余数据持有方和云服务器C;步骤2:所有数据持有方{P0,P1…Pn-1}、云服务器C生成各自的同态加密公钥和私钥对pkI,skI、pkc,skc,其中pkI是PI方的公钥,skI是PI方的私钥,pkc是云服务器C的公钥,skc是云服务器C的私钥,各方将其公钥广播至其他参与方;步骤3:n个数据持有方利用秘密参数加密自己的样本id集合IDI以及对应的特征数据XI,其中IDI、XI是PI方拥有的样本id集合和相应的特征数据集合,并将加密后的IDI、XI上传至云服务器C处保存;步骤4:当某一数据持有方PI作为数据请求方想要联合某多方特征数据进行模型训练时,该数据持有方PI请求云服务器C进行特征数据对齐协议;步骤5:云服务器C与数据持有方PI完成特征数据对齐协议后,各拥有对齐后特征数据的一份秘密共享,之后云服务器C和数据持有方PI进行基于秘密共享的隐私保护机器学习协议完成模型的训练。
全文数据:
权利要求:
百度查询: 浙大宁波理工学院 一种基于云端的保护交集样本ID的多方特征数据对齐方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。