首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于Shamir安全多方计算的隐私保护多方强化学习系统及方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海交通大学

摘要:一种基于Shamir安全多方计算的隐私保护多方强化学习系统及方法,包括:基于shamir的安全定点数计算模块、基于定点数计算实现的安全梯度下降模块、基于安全梯度下降实现的服务器mix网络模块、智能体网络模块和智能体‑服务器通信模块,本发明使用Shamir的秘密分享方案形成服务器间的安全随机梯度下降算法的协议,获得了更灵活的部署能力,并且能够容忍一些掉线。本发明根据安全协议的要求修改Q‑mix模型的网络,确保其对半诚实对手的安全性。

主权项:1.一种基于Shamir安全多方计算的隐私保护多方强化学习系统,其特征在于,包括:基于shamir的安全定点数计算模块、基于定点数计算实现的安全梯度下降模块、基于安全梯度下降实现的服务器mix网络模块、智能体网络模块和智能体-服务器通信模块,其中:安全定点数计算模块以计算输入值的秘密分享为输入,通过同态计算,得到计算输入值经过计算的结果的输出秘密分享;安全梯度下降模块根据神经网络输入的秘密分享进行同态的梯度下降计算,将以秘密分享为形式存在与各服务器处的网络参数进行优化;服务器混合网络模块根据智能体网络模块所提交的局部Q值的秘密分享,输出整体Q值的秘密分享,并计算总体奖励,进行梯度下降算法中前向与后向的安全计算,得到参数优化的结果,并提供给智能体网络以供智能体网络优化;智能体网络模块根据状态信息进行网络前向计算得到局部Q值,即本地Q值并生成秘密分享后输出至服务器混合网络模块进行综合与优化,并基于服务器mix网络模块在优化过程中的输出优化本身持有的智能体网络参数,得到优化后的智能体网络参数;智能体-服务器通信模块根据负责各方通信,模型中各服务器两两相连,每个智能体都与每个服务器相连,因此通信内容包括智能体向服务器提交的秘密分享与服务器之间安全计算时通信的秘密分享。

全文数据:

权利要求:

百度查询: 上海交通大学 基于Shamir安全多方计算的隐私保护多方强化学习系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。