买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:郑州大学
摘要:本发明公开了一种基于联盟链的多中心联邦学习数据共享方法,包括由联盟链网络、星际文件系统网络以及联邦学习单元组成的系统,还包括以下步骤:S1:初始化;S2:身份注册和授权;S3:联合建模准备;S4:联合建模训练;S5:联合建模组内聚合;S6:联合建模组间聚合;S7:联合建模结束;本发明中既能够确保数据不可篡改,又能够实现数据溯源;提升了系统的高可用性和安全性;既能够排除恶意节点,又能够提高吞吐量;采用信誉值评估机制,提高共享模型的质量。
主权项:1.一种基于联盟链的多中心联邦学习数据共享方法,其特征在于,包括由联盟链网络、星际文件系统网络以及联邦学习单元组成的系统,还包括以下步骤:S1:初始化;将意向组成联盟的所有节点进行资格审查,将审查通过的节点根据共识算法动态分成多个小组,每个小组内选出一个节点作为汇聚节点,小组之间形成联盟链网络;S2:身份注册和授权;每个节点均需要联盟链网络中的智能合约单元完成身份检验,每个节点能够作为任务发布者上传任务需要和任务信息到联盟链网络;S3:联合建模准备;任务发布者可作为数据请求方并需要提供统一的联邦学习单元和共享模型,剩余部分或者全部节点可作为数据提供方通过联邦学习单元和共享模型进行本地数据处理和模型测试,数据提供方再将数据处理和模型测试的结果发布到联盟链网络;S4:联合建模训练;任务发布者通告所有数据提供方开始训练任务,数据提供方在本地数据集训练局部模型,训练完成后,将本地模型参数上传到星际文件系统网络并获取返回值,再将返回值上传到联盟链网络,当上传的数据提供方的数量达到阈值时,汇聚节点给智能合约单元发出聚合任务请求并执行步骤S5;S5:联合建模组内聚合;汇聚节点将组内其他数据提供方上传的本地模型参数下载到本体,并根据基于信誉值的加权联邦平均算法进行组内聚合任务;S6:联合建模组间聚合;当所有汇聚节点完成组内聚合任务后,采用轮询机制从汇聚节点中选出一个节点承担组间聚合任务,将所有小组上传的本地模型参数聚合成新模型参数,并更新共享模型;S7:联合建模结束;在步骤S6完成本轮更新共享模型后,根据历史行为和当前行为评估数据提供方的信誉值,完成数据提供方的信誉值更新;在根据全局配置信息,继续进行下一轮训练任务,执行步骤4、步骤5、步骤6、步骤7直到共享模型收敛;所述基于信誉值的加权联邦平均算法包括信誉值计算步骤和模型聚合步骤;所述信誉值计算步骤描述如下:首先信誉值属性矩阵表示为P,其中xo表示参与者模型训练历史评估的信誉值,xi表示模型测试准确率,x2表示模型测试损失,x3表示训练集大小,x4表示学习率,x5表示局部迭代轮次,x6表示局部批处理大小;信誉值的计算公式如下:采用均值方差归一化对信誉值属性集合进行预处理; 其中,xij为第i个数据提供方的第j个指标的数据值,yij为归一化后的数据值,μ表示信誉值属性集合的均值,S表示信誉值属性集合的方差;接着计算各属性的信息熵,计算公式如下: 其中,N为节点总数,如果pij=0;则定义接着,根据信息熵确定各信誉值属性的权重值,计算公式如下: 其中,t为属性的个数,Ej为第j个属性的信息熵;最后根据属性权重,计算信誉值,计算公式如下: 所述模型聚合步骤描述如下:首先,小组内采用汇聚节点承担聚合任务;其次,有轮询机制选择一个汇聚节点,汇聚节点完成组间的聚合任务,生成共享模型;最后,本轮任务训练结束,将共享模型参数分发给所述数据提供方更新本地模型,迭代直至收敛。
全文数据:
权利要求:
百度查询: 郑州大学 一种基于联盟链的多中心联邦学习数据共享方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。