基于Transformer的移动众包收益最优的反向拍卖任务分配方法

导航：龙图腾网> 最新专利技术> 基于Transformer的移动众包收益最优的反向拍卖任务分配方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：云南大学

摘要：本发明公开了一种基于Transformer的移动众包收益最优的反向拍卖任务分配方法，获取移动众包数据搜集任务信息，然后收集若干信息相同的移动众包数据搜集任务的训练样本，每个训练样本的输入数据包括出价矩阵和价值矩阵，标签数据包括任务分配矩阵和用户支付向量；构建基于Transformer的反向拍卖模型，包括输入数据预处理模块，交互模块，全局特征图拆分模块，分配方案计算模块和支付方案计算模块，采用得到的训练样本对基于Transformer的反向拍卖模型进行训练；当需要进行移动众包数据搜集任务时，获取当前的出价矩阵和价值矩阵，输入训练好的反向拍卖模型中，得到任务分配矩阵和用户支付向量。本发明利用深度学习的方法来进行移动众包任务的分配和确定给予获胜用户的支付，以此寻求服务提供商数据收益的最大化。

主权项：1.一种基于Transformer的移动众包收益最优的反向拍卖任务分配方法，其特征在于，包括以下步骤：S1：获取移动众包数据搜集区域内的兴趣点集合参与数据收集的用户集合和服务提供商的预算B；S2：收集若干与步骤S1中信息相同的移动众包数据搜集任务的训练样本，每个训练样本的输入数据包括出价矩阵和价值矩阵出价矩阵中每个元素bim表示用户i对兴趣点POIm的数据收集任务出价，i＝1,2,...,N，m＝1,2,...,M，记用户i的出价向量bi＝bi1,bi2,…,biM，价值矩阵中每个元素rim表示用户i在兴趣点POIm处完成数据收集任务为服务提供商带来的收入；标签数据包括任务分配矩阵和用户支付向量其中任务分配矩阵A中每个元素Aim表示用户i是否被选择在兴趣点POIm收集数据，如果是，则Ai,m＝1，否则Ai,m＝0，用户支付向量P中每个元素Pi表示服务提供商对用户i的支付价格；S3：构建基于Transformer的反向拍卖模型，包括输入数据预处理模块，交互模块，全局特征图拆分模块，分配方案计算模块和支付方案计算模块，其中：输入数据预处理模块用于对出价矩阵b和价值矩阵r进行预处理，得到特征张量并发送至交互模块，d表示预设的特征通道数；输入数据预处理模块包括用户平均模块，兴趣点平均模块，卷积模块和特征融合模块，其中：用户平均模块用于对出价矩阵b和价值矩阵r分别进行按列平均，得到大小为1×M的用户平均出价向量和用户平均价值向量，然后复制N行，得到用户平均出价矩阵和用户平均价值矩阵并发送至特征融合模块；兴趣点平均模块用于对出价矩阵b和价值矩阵r分别进行按行平均，得到大小为N×1的兴趣点平均出价向量和兴趣点平均价值向量，然后复制N列，得到兴趣点平均出价矩阵和兴趣点平均价值矩阵并发送至特征融合模块；卷积模块用于对出价矩阵b和价值矩阵r分别进行卷积操作，得到对应的特征矩阵和并发送至特征融合模块；特征融合模块用于将出价矩阵b和价值矩阵r，以及接收到的用户平均出价矩阵兴趣点平均出价矩阵特征矩阵用户平均价值矩阵兴趣点平均价值矩阵和特征矩阵进行合并，得到特征张量G：交互模块用于捕捉特征张量G中的特征交互，得到全局特征图F并发送至全局特征图拆分模块；交互模块包括Q个级联的Transformer交互单元，每个Transformer交互单元包括第一Transformer模块，第二Transformer模块，特征拼接模块和卷积模块，其中：第一Transformer模块用于对每个用户i与M个兴趣点POIm进行交互，得到每个用户i的交互特征矩阵从而得到用户交互特征张量并发送至特征拼接模块；第二Transformer模块用于对每个兴趣点POIm与N个用户进行交互，得到每个兴趣点POIm的交互特征矩阵从而得到兴趣点交互特征张量并发送至特征拼接模块；特征拼接模块用于将用户交互特征张量Tr和兴趣点交交互特征张量Tc进行拼接，得到特征卷积模块用于对特征Ts进行卷积操作并将得到的特征进行输出，其中前Q-1个Transformer交互单元中卷积模块的输出特征大小为输出至下一个Transformer交互单元，第Q个Transformer交互单元中卷积模块的输出特征大小为并作为全局特征图F输出至全局特征图拆分模块；全局特征图拆分模块用于将全局特征图F拆分得到2个大小为N×M的二维矩阵，分别作为分配特征矩阵Fa和支付特征矩阵Fp，将分配特征矩阵Fa发送至分配方案计算模块，将支付特征矩阵Fp发送至支付方案计算模块；分配方案计算模块用于采用sigmoid激活函数对分配特征矩阵Fa进行处理，得到每个用户i被选择在每个兴趣点POIm收集数据的概率从而得到任务分配矩阵支付方案计算模块用于对支付特征矩阵Fp逐行求和，得到用户i的支付价格表示支付特征矩阵Fp中用户i在兴趣点POIm上的支付特征值，从而得到用户支付向量S4：采用如下方法对步骤S3中构建的基于Transformer的反向拍卖模型进行训练，具体步骤包括：S4.1：根据实际情况初始化拉格朗日乘子设置拉格朗日乘子的更新周期更新系数ρλ＞0，ρη＞0，ρμ＞0，梯度上升学习率α＞0，梯度下降学习率β＞0，迭代总次数S4.2：令迭代次数t＝1；S4.3：从步骤S2所收集的所有训练样本中选择K个训练样本作为当前批次训练样本集St；S4.4：对于每个用户i，初始化其对于每个训练样本的谎报出价其中Vi是用户i的所有可能估价的集合；S4.5：采用如下公式对每个用户i的谎报出价进行H次迭代更新，H的值根据实际需要设置，更新公式为：其中，rk表示当前批次训练样本k中服务提供商的价值矩阵，表示当前批次中训练样本k中不包括用户i的其他用户的出价，表示在价值矩阵rk和用户出价下的用户i的效用，▽表示求取梯度，w表示反向拍卖模型的参数；S4.6：采用如下公式计算当前模型参数wt下训练样本k中用户i通过谎报出价可以获得的最大效用期望其中，bk表示当前批次中训练样本k中所有用户的出价矩阵；然后计算最大效用期望的梯度采用如下公式计算当前模型参数wt下训练样本k中用户i的个体理性惩罚其中，表示当前批次中训练样本k中用户i对兴趣点POIm的出价，表示当前批次中训练样本k中用户i是否被选择在兴趣点POIm收集数据，表示当前批次中服务提供商对训练样本k中服务提供商对用户i的支付价格；然后计算个体理性惩罚的梯度▽wirikwt；采用如下公式计算当前模型参数wt下训练样本k中用户i的预算可行性惩罚bfkwt：其中，B表示服务提供商的预算；然后计算预算可行性惩罚bfkwt的梯度▽wbfkwt；S4.7：采用如下公式更新基于Transformer的反向拍卖模型的参数：其中，表示当前迭代轮次的拉格朗日损失函数梯度，其计算公式为：其中，▽wRwrk,bk表示训练样本k中服务提供商收益函数的梯度；S4.8：判断是否t＜T，如果是，进入步骤S4.9，否则反向拍卖模型训练结束；S4.9：将拉格朗日函数的相应乘数分别根据预设更新周期Tλ,Tη,Tμ进行更新，具体方法为：判断是否当前迭代次数达到更新周期Tλ，如果未达到，则令下一次迭代时的拉格朗日乘数否则令下一次迭代时的拉格朗日乘数判断是否当前迭代次数达到更新周期Tη，如果未达到，则令下一次迭代时的拉格朗日乘数否则令下一次迭代时的拉格朗日乘数判断是否当前迭代次数达到更新周期Tμ，如果未达到，则令下一次迭代时的拉格朗日乘数μt+1＝μt，否则令下一次迭代时的拉格朗日乘数μt+1＝μt+ρμbfwt+1；S4.10：令迭代次数t＝t+1，返回步骤S4.3；S5：当需要进行移动众包数据搜集任务时，获取当前的出价矩阵b和价值矩阵r，输入训练好的反向拍卖模型中，得到任务分配矩阵A和用户支付向量P。

全文数据：

权利要求：

百度查询：云南大学基于Transformer的移动众包收益最优的反向拍卖任务分配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：具有均匀氢键合相互作用、同碱基对和异碱基对偏好以及错配辨别力的修饰核碱基

下一篇：一种AGV随行系统、方法、装置、设备及存储介质

相关技术

具有均匀氢键合相互作用、同碱基对和异碱基对偏好以及错配辨别力的修饰核碱基

一种AGV随行系统、方法、装置、设备及存储介质

一种金属镱的显微组织显示方法

一种音频信号的处理方法、装置、系统和智能音箱设备

一种室内立式蔬菜栽培架

一种基于蜣螂优化算法的智能车轨迹跟踪控制方法

降噪模型的训练方法、图像降噪方法、电子设备及介质

一种煤矿井下风水管路在线监测系统

公路软土路基超载预压时超载比的确定方法、装置及介质

一种一体式行星齿轮组减速机构

一种汽车电子设备和菊花链通信的超时复位系统

一种塑管熔接装置

收益相关技术

考虑辅助服务市场收益的电氢协同系统规划方法及装置_国网能源研究院有限公司_202411451542.0

收益规则信息的模糊边界推断方法及其装置_北京清鹏智能科技有限公司_202411056240.3

一种基于收益最大化的商超定价与补货方法_河海大学_202410727095.0

一种光伏发电项目收益率测算方法_上海能源科技发展有限公司_202411028657.9

一种基于发电商收益-报价灵敏度矩阵的电力现货市场市场力快速筛选系统_广东电力交易中心有限责任公司_202311219215.8

一种TOU收益计算单元、光伏TOU模式智能管理系统_上海思格源智能科技有限公司_202410545227.8

光伏项目投资收益快速测算系统、方法及计算机存储介质_河南中核五院研究设计有限公司_202410393565.4

基于多维数据分析的企业每股收益预测系统_上海外国语大学_202410884111.7

一种基于电池成本的车网互动收益平衡方法及系统_广西电网有限责任公司电力科学研究院_202410739714.8

基于时空图学习的停车场收益预测核算方法_松立控股集团股份有限公司_202411319433.3

反向相关技术

反向输入切断离合器_日本精工株式会社_202280094336.1

一种大推力单螺杆反向承载机构_铜陵格瑞特科技股份有限公司_202420615061.8

正反向定位的柔性屏抽拉机构_东莞市劲丰电子有限公司_202010905762.1

一种微波公共端口反向布局开关_北京雷格讯电子股份有限公司_202411144110.5

一种内置反向器的滚珠丝杠及其滚珠丝杠副_浙江坤亿佳机械制造有限公司_202411120030.6

一种装配式反向跌级的吊顶系统_浙江亚厦装饰股份有限公司_202210299153.5

基于OFDM信号的反向散射室内定位方法及系统_电子科技大学(深圳)高等研究院_202411168552.3

基于残差反向瓶颈和稀疏注意力的图像分割方法与系统_湖南工商大学_202411406045.9

一种同轴式反向自锁减速机_安易行(常州)新能源科技有限公司_202411097064.8

一种提高NDV反向遗传载体外源蛋白表达量的方法_中国农业科学院上海兽医研究所(中国动物卫生与流行病学中心上海分中心)_202411174405.7

最优相关技术

一种计算PCB利用率与净面积最优成本的方法_奥士康科技股份有限公司_202411052762.6

单相三电平PWM整流器的谐波抑制及最优SVPWM调制方法_吉林大学_202410957364.2

一种在测量噪声下的并网逆变器最优控制方法_安徽工业大学_202411071285.8

获取最优地表类型数据集配置的方法和设备_北京金风慧能技术有限公司_201911355286.4

一种行星系统内多卫星借力燃耗最优轨道优化方法_北京理工大学_202411220658.3

停车场泊位最优路径引导方法、系统、电子设备及介质_松立控股集团股份有限公司_202411448075.6

一种基于学情模型的最优学习路径生成方法_四川启鸣达人科技有限公司_202411463659.0

腿足式着陆器及其运动能耗最优的轨迹规划方法_南京航空航天大学_202411029842.X

一种双瓣抓斗起重机最优抓取点识别方法_大连九州创智科技有限公司_202411268174.6

一种并行最优输运无网格的冲击碰撞过程模拟方法及应用_云翼(嘉兴)软件科技有限公司_202411442797.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于Transformer的移动众包收益最优的反向拍卖任务分配方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务