Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于联邦学习的在线客户端选择方法、系统、介质及设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东大学

摘要:本发明涉及计算机领域,公开了一种基于联邦学习的在线客户端选择方法、系统、介质及设备。本发明将夏普利值技术与多臂老虎机技术相结合,设计基于客户端贡献度的联邦学习客户端在线选择方法,帮助服务器不断选择高质量的客户端参与联邦学习过程,提高模型性能。

主权项:1.一种基于联邦学习的在线客户端选择方法,其特征在于,包括以下步骤:步骤一,初始阶段,服务器选择全部客户端,然后服务器将当前全局模型发送给选中的客户端;步骤二,被选中的客户端接收全局模型,并利用本地数据进行模型的学习更新,然后将本地模型更新上传至服务器;步骤三,服务器收到客户端的本地模型更新后,聚合本地模型更新从而更新全局模型,得到新一轮的全局模型;步骤四,服务器借助全局验证集,根据客户端的本地模型更新计算客户端的夏普利值,以此来衡量客户端对全局学习目标的贡献度;令表示N个客户端的集合,表示第t轮选择的客户端的集合,为合作博弈模型的特征函数,描述了中每组联合体对联邦学习任务的贡献度,特征函数v定义如下: 其中,表示由联邦学习中心服务器所保存的能够反映联邦学习任务全局目标的验证数据集,为验证数据集样本数量,为指示函数,θt为第t轮中由聚合本地模型得到的全局模型,Jx,θt表示全局模型θt在数据样本上的预测结果;基于上述特征函数,客户端在第t轮的夏普利值可以定义为: 其中,再通过归一化,可以得到[0,1]区间内的夏普利值;用来度量客户端的本地模型在验证数据集上的准确度,即客户端在第t轮中贡献的训练数据的质量;步骤五,根据客户端的夏普利值更新客户端的置信值,并且根据置信值,服务器进行新一轮次的K个客户端的选择,并将当前全局模型发送至被选择的客户端,重复步骤二至四,直至达到预先设定的学习轮数或损失值达到规定阈值内,学习停止;令z{i,t}∈{0,1}表示是否在轮次t中选择客户端i;在多臂老虎机模型中,每一臂视为一个客户端,该臂的奖励使用对应的夏普利值表示,在轮次t+1中,为每一个客户端计算如下的UCB值: 其中表示客户端i在轮次区间[1,t]内的平均夏普利值,λi,t表示客户端i在轮次区间[1,t]中被选中的次数;在轮次t+1中,选中当前置信值较大的前K个客户端参与下一轮联邦学习过程,依次往复直至学习完成。

全文数据:

权利要求:

百度查询: 山东大学 基于联邦学习的在线客户端选择方法、系统、介质及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。