买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中南大学
摘要:本发明涉及联邦学习技术领域,具体公开了一种面向数据多元异质场景下的聚类联邦学习方法,首次将向量量化变分自编码器融入联邦学习框架中,以向量量化变分自编码器有效学习并映射本地数据分布至离散特征空间,通过利用此离散空间变量的相似度执行客户端聚类,既保护了本地数据隐私,又有效地压缩了特征表示,同时引用特征锚点进行不同客户端特征字典中的特征对齐,保证了不同客户端特征字典的同一个位置在同一特征空间,进而确保了跨客户端聚合的一致性,解决了传统的面向数据多元异质场景下的联邦学习,因数据的异质性因素会削弱模型在整体数据集上的泛化能力,增加模型对特定客户过拟合风险以及存在任务不平衡的问题。
主权项:1.一种面向数据多元异质场景下的聚类联邦学习方法,其特征在于:包括如下步骤:步骤S1:初始化模型参数w、特征字典的特征向量、全局特征锚点向量,且i的取值为1到K,K表示特征字典中向量的总数;其中,在初始化模型参数时,模型参数的架构包括对特征提取器模块的架构、对向量量化变分自编码器模块的架构和对分类器模块的架构;并设定特征提取器的模型参数表示为,设定向量量化变分自编码器模块的模型参数表示为,设定分类器模块的模型参数表示为,经过初始化后的模型参数的表达式为:;步骤S2:在每轮迭代的开始,由中央服务器向所有客户端广播当前的模型参数信息wg、当前的特征字典的特征向量、当前的全局特征锚点向量,客户端接收后开始进行本地训练,且初始化迭代轮次t=1;在初始迭代轮次中,令;其中,初始化迭代轮次t=1;表示第t-1轮第g簇的特征提取器参数,示第t-1轮第g簇的分类器参数;步骤S3:每个客户端m利用本地数据集优化损失函数Llocal进行本地训练,并上传更新后的特征向量和模型参数wm到中央服务器,M表示客户端m的总数;其中,模型参数;步骤S4:进行客户端聚类,由中央服务器计算每个客户端的特征字典的特征向量的变化量,采用层次聚类法以依据每个客户端的特征向量的变化量进行分簇,得到若干不同的模型参数簇;步骤S5:由中央服务器进行各模型参数簇之间的聚合,包括簇内特征提取器平均聚合、簇间分类器个性化聚合和特征向量与全局特征锚点的更新;其中,簇间分类器个性化聚合为通过调整不同簇间的分类器参数以适应各客户端特定需求,并根据簇间分类器的相似性进行的聚合;步骤S6:重复步骤S2至步骤S5直至模型收敛。
全文数据:
权利要求:
百度查询: 中南大学 一种面向数据多元异质场景下的聚类联邦学习方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。