买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:云南大学
摘要:本发明公开了一种基于Transformer的移动众包收益最优的反向拍卖任务分配方法,获取移动众包数据搜集任务信息,然后收集若干信息相同的移动众包数据搜集任务的训练样本,每个训练样本的输入数据包括出价矩阵和价值矩阵,标签数据包括任务分配矩阵和用户支付向量;构建基于Transformer的反向拍卖模型,包括输入数据预处理模块,交互模块,全局特征图拆分模块,分配方案计算模块和支付方案计算模块,采用得到的训练样本对基于Transformer的反向拍卖模型进行训练;当需要进行移动众包数据搜集任务时,获取当前的出价矩阵和价值矩阵,输入训练好的反向拍卖模型中,得到任务分配矩阵和用户支付向量。本发明利用深度学习的方法来进行移动众包任务的分配和确定给予获胜用户的支付,以此寻求服务提供商数据收益的最大化。
主权项:1.一种基于Transformer的移动众包收益最优的反向拍卖任务分配方法,其特征在于,包括以下步骤:S1:获取移动众包数据搜集区域内的兴趣点集合参与数据收集的用户集合和服务提供商的预算B;S2:收集若干与步骤S1中信息相同的移动众包数据搜集任务的训练样本,每个训练样本的输入数据包括出价矩阵和价值矩阵出价矩阵中每个元素bim表示用户i对兴趣点POIm的数据收集任务出价,i=1,2,...,N,m=1,2,...,M,记用户i的出价向量bi=bi1,bi2,…,biM,价值矩阵中每个元素rim表示用户i在兴趣点POIm处完成数据收集任务为服务提供商带来的收入;标签数据包括任务分配矩阵和用户支付向量其中任务分配矩阵A中每个元素Aim表示用户i是否被选择在兴趣点POIm收集数据,如果是,则Ai,m=1,否则Ai,m=0,用户支付向量P中每个元素Pi表示服务提供商对用户i的支付价格;S3:构建基于Transformer的反向拍卖模型,包括输入数据预处理模块,交互模块,全局特征图拆分模块,分配方案计算模块和支付方案计算模块,其中:输入数据预处理模块用于对出价矩阵b和价值矩阵r进行预处理,得到特征张量并发送至交互模块,d表示预设的特征通道数;输入数据预处理模块包括用户平均模块,兴趣点平均模块,卷积模块和特征融合模块,其中:用户平均模块用于对出价矩阵b和价值矩阵r分别进行按列平均,得到大小为1×M的用户平均出价向量和用户平均价值向量,然后复制N行,得到用户平均出价矩阵和用户平均价值矩阵并发送至特征融合模块;兴趣点平均模块用于对出价矩阵b和价值矩阵r分别进行按行平均,得到大小为N×1的兴趣点平均出价向量和兴趣点平均价值向量,然后复制N列,得到兴趣点平均出价矩阵和兴趣点平均价值矩阵并发送至特征融合模块;卷积模块用于对出价矩阵b和价值矩阵r分别进行卷积操作,得到对应的特征矩阵和并发送至特征融合模块;特征融合模块用于将出价矩阵b和价值矩阵r,以及接收到的用户平均出价矩阵兴趣点平均出价矩阵特征矩阵用户平均价值矩阵兴趣点平均价值矩阵和特征矩阵进行合并,得到特征张量G: 交互模块用于捕捉特征张量G中的特征交互,得到全局特征图F并发送至全局特征图拆分模块;交互模块包括Q个级联的Transformer交互单元,每个Transformer交互单元包括第一Transformer模块,第二Transformer模块,特征拼接模块和卷积模块,其中:第一Transformer模块用于对每个用户i与M个兴趣点POIm进行交互,得到每个用户i的交互特征矩阵从而得到用户交互特征张量并发送至特征拼接模块;第二Transformer模块用于对每个兴趣点POIm与N个用户进行交互,得到每个兴趣点POIm的交互特征矩阵从而得到兴趣点交互特征张量并发送至特征拼接模块;特征拼接模块用于将用户交互特征张量Tr和兴趣点交交互特征张量Tc进行拼接,得到特征卷积模块用于对特征Ts进行卷积操作并将得到的特征进行输出,其中前Q-1个Transformer交互单元中卷积模块的输出特征大小为输出至下一个Transformer交互单元,第Q个Transformer交互单元中卷积模块的输出特征大小为并作为全局特征图F输出至全局特征图拆分模块;全局特征图拆分模块用于将全局特征图F拆分得到2个大小为N×M的二维矩阵,分别作为分配特征矩阵Fa和支付特征矩阵Fp,将分配特征矩阵Fa发送至分配方案计算模块,将支付特征矩阵Fp发送至支付方案计算模块;分配方案计算模块用于采用sigmoid激活函数对分配特征矩阵Fa进行处理,得到每个用户i被选择在每个兴趣点POIm收集数据的概率从而得到任务分配矩阵支付方案计算模块用于对支付特征矩阵Fp逐行求和,得到用户i的支付价格表示支付特征矩阵Fp中用户i在兴趣点POIm上的支付特征值,从而得到用户支付向量S4:采用如下方法对步骤S3中构建的基于Transformer的反向拍卖模型进行训练,具体步骤包括:S4.1:根据实际情况初始化拉格朗日乘子设置拉格朗日乘子的更新周期更新系数ρλ>0,ρη>0,ρμ>0,梯度上升学习率α>0,梯度下降学习率β>0,迭代总次数S4.2:令迭代次数t=1;S4.3:从步骤S2所收集的所有训练样本中选择K个训练样本作为当前批次训练样本集St;S4.4:对于每个用户i,初始化其对于每个训练样本的谎报出价其中Vi是用户i的所有可能估价的集合;S4.5:采用如下公式对每个用户i的谎报出价进行H次迭代更新,H的值根据实际需要设置,更新公式为: 其中,rk表示当前批次训练样本k中服务提供商的价值矩阵,表示当前批次中训练样本k中不包括用户i的其他用户的出价,表示在价值矩阵rk和用户出价下的用户i的效用,▽表示求取梯度,w表示反向拍卖模型的参数;S4.6:采用如下公式计算当前模型参数wt下训练样本k中用户i通过谎报出价可以获得的最大效用期望 其中,bk表示当前批次中训练样本k中所有用户的出价矩阵;然后计算最大效用期望的梯度采用如下公式计算当前模型参数wt下训练样本k中用户i的个体理性惩罚 其中,表示当前批次中训练样本k中用户i对兴趣点POIm的出价,表示当前批次中训练样本k中用户i是否被选择在兴趣点POIm收集数据,表示当前批次中服务提供商对训练样本k中服务提供商对用户i的支付价格;然后计算个体理性惩罚的梯度▽wirikwt;采用如下公式计算当前模型参数wt下训练样本k中用户i的预算可行性惩罚bfkwt: 其中,B表示服务提供商的预算;然后计算预算可行性惩罚bfkwt的梯度▽wbfkwt;S4.7:采用如下公式更新基于Transformer的反向拍卖模型的参数: 其中,表示当前迭代轮次的拉格朗日损失函数梯度,其计算公式为: 其中,▽wRwrk,bk表示训练样本k中服务提供商收益函数的梯度;S4.8:判断是否t<T,如果是,进入步骤S4.9,否则反向拍卖模型训练结束;S4.9:将拉格朗日函数的相应乘数分别根据预设更新周期Tλ,Tη,Tμ进行更新,具体方法为:判断是否当前迭代次数达到更新周期Tλ,如果未达到,则令下一次迭代时的拉格朗日乘数否则令下一次迭代时的拉格朗日乘数判断是否当前迭代次数达到更新周期Tη,如果未达到,则令下一次迭代时的拉格朗日乘数否则令下一次迭代时的拉格朗日乘数判断是否当前迭代次数达到更新周期Tμ,如果未达到,则令下一次迭代时的拉格朗日乘数μt+1=μt,否则令下一次迭代时的拉格朗日乘数μt+1=μt+ρμbfwt+1;S4.10:令迭代次数t=t+1,返回步骤S4.3;S5:当需要进行移动众包数据搜集任务时,获取当前的出价矩阵b和价值矩阵r,输入训练好的反向拍卖模型中,得到任务分配矩阵A和用户支付向量P。
全文数据:
权利要求:
百度查询: 云南大学 基于Transformer的移动众包收益最优的反向拍卖任务分配方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。