恭喜东南大学深圳研究院徐博文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜东南大学深圳研究院申请的专利一种基于多用户博弈与联邦学习的车联网计算卸载方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115134778B 。
龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210744843.7,技术领域涉及:H04W4/44;该发明授权一种基于多用户博弈与联邦学习的车联网计算卸载方法是由徐博文;宋晓勤;宋铁成;王书墨;张文静设计研发完成,并于2022-06-28向国家知识产权局提交的专利申请。
本一种基于多用户博弈与联邦学习的车联网计算卸载方法在说明书摘要公布了:本发明提出的一种基于多用户博弈与联邦学习的车联网计算卸载方法,采用二进制卸载的方式对信道和功率进行选择,利用势博弈算法和联邦学习算法共同优化深度Q网络,通过这种方式选择的信道与发射功率可以有效降低整个系统的总开销,即减小服务时延、降低系统能量损耗。本发明使用的势博弈算法可以使用户车辆在训练之前就获得近最优的卸载决策,让深度Q网络更有效地收敛,经过训练的智能体能在特定环境中做出对整体最有利的卸载决策,降低系统开销,且经过联邦学习优化后的深度Q网络训练出的模型能够很好地适应于更多用户的场景,具备一定的鲁棒性。
本发明授权一种基于多用户博弈与联邦学习的车联网计算卸载方法在权利要求书中公布了:1.一种基于多用户博弈与联邦学习的车联网计算卸载方法,其特征在于,包括步骤如下:1构建包含用户车辆、服务车辆和路边单元的车联网系统模型,用户车辆VC可以将计算任务卸载至服务车VS和路边单元RU以减小总的系统开销Csum;2基于用户车辆选择将所有的计算任务放到本地执行,不进行卸载或选择将计算任务卸载到辅助计算单元上进行计算,联合选择用户车辆的卸载节点、信道、传输功率,即只需要通过一个动作变量参数就可以得到用户车辆VC所有的卸载信息;3将优化多用户整体开销拆解成优化每个设备的开销,采用多用户博弈的分布式卸载算法辅助车联网场景中的用户车辆选择最优卸载方案;4将由K个用户经过博弈后做出的卸载动作构成集合作为初始卸载方案,以最小化系统总开销Csum为目标构建深度Q网络;5为提高由深度强化学习训练出的卸载模型的泛化能力,通过联邦学习优化深度Q网络;6在测试过程中,用户车辆VC加载提前训练好的网络模型,根据当前环境信息选择最适合的卸载信道和传输功率;进一步,所述步骤1包括如下具体步骤:1a,在该卸载模型中,优化的最终目标是减小系统总开销Csum,它由总时延Tsum与总能量损耗Esum按照一定比例共同组成,其计算公式可以表示为:Csum=λ1Tsum+λ2Esum其中,λ1和λ2为总时延Tsum与总能量损耗Esum的占比权重,它们同时满足: 在追求尽可能减小时延的业务中,λ1的值更大,在能源相对有限的业务中,λ2的值更大;1b,总时延Tsum包含整个系统的总数据传输时延和总计算时延当用户车辆选择将所有数据下放至本地计算时,1c,定义用户车集合为:{0,1,2,...,k,...,K},卸载信道集合为:{0,1,2,...,l,...,L},当用户车辆选择计算卸载时,用如下公式进行计算: 其中,dk表示用户车辆k所需要计算的总的数据量,L表示总的信道数量,Φl表示第l个信道是否被用户k占用,当Φl的值为0表示该信道不被占用,当Φl的值为1表示该信道被占用,B表示每条信道所分配的带宽,Pk为第k个用户车辆的发射功率,gC,S表示VC与VS之间产生的信道增益;1d,总计算时延用如下公式进行计算: 其中,ωk表示辅助计算单元分配给用户k的算力资源比例,这里按照每个辅助计算单元的信道数量对算例资源进行均分,本地计算时ωk=1,v表示对应计算单元的计算速度;1e,总能量损耗Esum包含两个部分,分别为选择本地计算用户的总能量损耗与选择计算卸载的用户总能量损耗其公式为: 1f,本地计算用户的总能量损耗为自身计算能耗,选择卸载的车辆不代入计算,表达式为: 选择计算卸载的用户总能量损耗为用户端传输数据的能量损耗,选择本地计算的车辆不代入计算,数据回传的能量损耗来源于服务端不计入系统开销,可以用如下公式计算: 其中,χ为能量系数,其值取决于CPU的芯片结构,vk为用户车辆的计算速度,其他如1c中所定义;进一步,所述步骤3包括如下具体步骤:3a初始化卸载动作集A={0,0,…,0},表示全部在本地进行计算;3b每个用户车辆VC进行分布式计算,找到可以使得整体开销Csum最小的单个用户的动作并更新到卸载动作集中;3c在进行若干次博弈迭代过程后,所有用户车辆的整体开销Csum达到一个无法继续减小的值,即达到纳什均衡,此时获得的卸载动作集就是经过多用户博弈过程优化后的初始卸载方案;进一步,所述步骤4包括如下具体步骤:4a建立状态空间集S,其中包含k个用户车辆的所观测到的状态训练迭代次数episode和ε贪心策略中的随机动作选择概率ε,dk表示用户车辆k包含的计算任务数据量,Gk包含用户车辆k所构成的各信道间的增益;4b定义服务车的数量为ns,路边辅助计算单元数量为nr,每条链路可分配的子信道数量为Ln,发射功率的选择有nP种,则动作空间的大小为:An=ns+nr×Ln×nP,An∈Z每个用户车辆的动作构成动作空间集A,通过反向并唯一求出卸载对象,所选信道以及发射功率;4c定义奖励函数Rt,设置最大收益值为则以减少时延和能量消耗为目标,为了最小化总开销,用户车辆在第t步的奖励函数设置为: 其中,在训练过程中为定值,可以自由调整便于训练;4d根据状态空间集S,动作空间集A和奖励函数Rt,以多用户博弈过程得到的卸载方案作为初始决策带入建立好的深度Q网络模型中进行训练;进一步,所述步骤5包括如下具体步骤:5a设置固定的步长间隔aggr,每经过该步长间隔用户车辆就将本地训练网络参数λk上传至路边单元RU进行联邦聚合;5b路边单元RU对用户上传的所有网络参数进行聚合计算,将所有参与联邦学习的用户车辆训练模型按照贡献度取加权平均值以获得最佳聚合效果,计算公式为: 其中,为联邦聚合后的全局网络参数,λk为第k个用户车辆在深度Q学习过程中预测的本地网络的参数,ηk为第k个用户车辆模型参数的贡献度;5c路边单元RU将经过联邦学习聚合后的全局网络参数分别下发给每一辆用户车用于更新本地网络参数λk,如未超过设置的episode训练周期,则继续进行训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学深圳研究院,其通讯地址为:518000 广东省深圳市南山区粤海街道虚拟大学园A212室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。