首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于区块链的联邦数据异构聚类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广西师范大学

摘要:本发明公开了一种一种基于区块链的联邦数据异构聚类方法,包括如下步骤:1)任务定义;2)FLRepresentative的选择;3)相似度对比。这种方法有效增强了数据隐私保护,避免了数据传输到中心服务器的需求。同时,通过对参与设备进行聚类,有效地应对了数据的非独立同分布(non‑IID)问题,从而提高了模型的泛化能力。此外,利用区块链技术实现去中心化的训练管理,减少了对中心服务器的依赖并降低了单点故障的风险。通过优化的聚类算法和数据处理流程,高效处理了大规模分布式数据集,显著提升计算效率和系统的扩展性。

主权项:1.基于区块链的联邦数据异构聚类方法,其特征在于,包括如下步骤:1任务定义:在联邦学习环境中,为实现一个多设备协作学习系统,对这个系统设计允许不同类型的设备充当一个联邦训练聚合服务器,设备称为FLRepresentatives即FLR,FLR将自己训练的数据集独立出一个单独部分充当验证集,该验证集用来验证数据隐私和安全,在整个联邦训练过程中包括多个关键任务:首先,各FLRepresentatives会根据本身持有的本地数据类型,利用哈希算法生成数据的草图,这种草图代表了数据的特征,这些草图随后会被安全地传输给任务发布者指定的云服务器,云服务器的任务是比对新设备上传的草图与现有的FLRepresentatives的草图,并根据相似性分析结果,指派新设备到最匹配的FLRepresentative进行进一步训练;接下来,各设备在本地执行机器学习模型的训练,更新模型参数,这一过程不涉及数据共享,训练完成后,参与本地训练的各个设备将模型梯度上传给FLRepresentative,FLR聚合这些梯度以更新该类型的评估,并评估设备的历史行为和信誉,这种评估有助于确定设备是否能加入现有的或新建的FLRepresentative进行训练;若设备没有足够的算力进行聚合操作,FLR能向云服务器发出请求,云服务器在验证这些请求后将参与到聚合过程中;2FLRepresentative的选择:首先,每个参与训练的本地设备在其设备上使用本地数据训练模型,并将更新的模型参数发送至FLR,随后,FLR采用平均聚合的方法聚合这些来自不同本地设备的模型更新,接着,通过验证集对聚合前后的全局模型进行性能评估,来量化各个本地训练客户的贡献,从而对每个设备进行信誉评估,根据模型性能的改进情况,相应地调整每个本地客户端的信誉度,这些操作的结果和相关数据会被记录在联盟区块链上,确保流程的透明性和数据的不可篡改性,从而在提升模型性能的同时,增强整体安全和可靠性;信誉度中声誉指标的定义:信任度bi:反映本地客户端i在之前的联邦学习任务中提供高质量数据和模型更新的程度;不信任度di:基于本地客户端i过去可能提供的低质量或有害的数据更新;不确定度ui:表示基于有限的交互历史,对本地客户端i行为预测的不确定性;主观逻辑模型:使用主观逻辑模型计算本地客户端的声誉,该模型结合信任度bi、不信任度di和不确定度ui来形成对本地设备的综合声誉评价,具体公式为:Ri=bi+1-bi-d,×W其中,Ri是本地设备i的声誉评分,W是基于历史行为和其他因素确定的一个系数,用于调整不确定度的影响;声誉数据的区块链管理:声誉数据存储在一个联盟区块链上,该区块链包含该类型训练客户的信息,且该区块链是一种特定类型的区块链,该区块链共识过程由预选的本地设备执行,具有低的成本和短的响应时间;区块链上的每个区块包含了一段时间内所有训练客户端的声誉交易记录,确保数据的不可篡改性和透明性;声誉更新过程:每当训练客户端完成一次任务并提交数据更新时,任务发布者根据更新的质量来调整该本地设备的信任度bi和不信任度di,同时,根据交互频率和交互结果,不确定度ui也会得到调整;更新的声誉信息被记录在区块链上,每个新的声誉评分都会通过区块链的共识机制进行验证并最终存储;使用实用拜占庭容错算法作为共识机制,用于确保声誉数据的一致性和安全性,每个参与的训练客户端在联邦学习任务完成后的表现会被转化为声誉分数,并打包成交易提交到区块链,一旦交易生成,一个区块链上负责协调共识过程的主节点提出新区块的提案,其他节点则进行验证这些声誉数据的有效性和完整性,通过预准备、准备和提交的三阶段消息传递,确保了超过三分之二的节点对数据和区块提案的一致同意,从而达成共识;利用声誉信息进行FLR选择:在新的联邦学习任务发布时,任务发布者会查询区块链以获取最新的声誉数据,并基于这些数据选择声誉高的客户端充当FLR,这种选择机制提高了任务的整体质量和可靠性; 3相似度对比:步骤1的系统中要将FLR的数据根据n个哈希函数生成草图向量,要参与本次训练的设备也采用相同方式生成自己所带数据的向量传输给云服务器,云服务器对比相似度分配所对应的FLR;相似度过程如下:3.1One-PassSketch构建:初始化一个零矩阵SR,B,矩阵SR,B将用作草图,其中R是行数,B是列数;对于训练客户端的数据集D中的每个数据点x,使用R个局部敏感散列即LSH函数计算哈希值,每个LSH函数将数据点映射到一个整数,该整数在[B]范围内,[B]表示一个离散的整数范围,用于映射数据点到矩阵S中的列;对于每个LSH函数hi,将对应的S[i,hx]计数增加1,其中i是函数的索引;3.2理论分析:草图距离计算:计算两个草图之间的距离,使用欧几里得距离Frobenius范数作为数据分布相似性的指标;客户端选择:在FL中,使用草图选择与全局数据分布更接近的客户端进行训练,以提高效率和模型性能;

全文数据:

权利要求:

百度查询: 广西师范大学 基于区块链的联邦数据异构聚类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。