Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于元学习和强化学习的图片数据推荐方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:合肥工业大学

摘要:本发明公开了一种基于元学习和强化学习的图片数据推荐方法,包括:1、仿真数据交易场景中的差异化数据;2、构建基于元学习的小样本训练模型;3、计算小样本场景中每个数据提供方对于模型训练的贡献度;4、设计强化学习奖励函数;5、设计数据提供方被选择概率函数;6、设计联邦训练聚合权重;7、构建终止条件,在连续几个迭代周期中,相对损失的变化小于设定阈值时,停止训练,并得到为数据需求方推荐的数据集。本发明能在样本量较少的情况下帮助数据需求方估算数据价值,同时能充分考虑到不同类别图片数据贡献值估计的不确定性,在不泄露数据的同时进行数据价值的精确估计与数据选择,从而使得推荐效率更高。

主权项:1.一种基于元学习和强化学习的图片数据推荐方法,其特征在于,应用于由一个数据需求方和M个数据提供方所组成的推荐场景中,并按如下步骤进行:步骤1、将M个数据提供方的本地图片数据集合记为D={D1,…,Di,…,DM},其中,Di表示第i个数据提供方的本地图片数据集合,且其中,dij表示第i个数据提供方的第j类本地图片数据,Ni是第i个数据提供方的本地图片数据的类别总数,j∈[1,Ni],i∈[1,M];步骤2、从Di中的每类本地图片数据中抽取若干图片数据并构成第i个数据提供方的小样本图片数据集其中,cij表示第i个数据提供方的第j类小样本图片数据,从而得到M个数据提供方的小样本图片集合C={C1,…Ci,…CM};将Ci划分为元训练集和元测试集将元训练集再划分为训练支持集和训练查询集其中,表示第i个数据提供方的训练支持集中的第k个图片支持样本,为的标签,且是第i个数据提供方的训练支持集中图片支持样本的总数;表示第i个数据提供方的训练查询集中的第h个图片查询样本,表示的标签;是第i个数据提供方的训练查询集中查询图片样本的总数;第i个数据提供方的元测试集再划分为测试支持集和测试查询集其中,表示第i个数据提供方的测试查询集中的第g个图片支持样本,为的标签,且是第i个数据提供方的测试查询集中图片支持样本的总数;将Di划分为训练集测试集和验证集步骤3、利用基模型构建小样本模型并进行训练,得到最优参数θ*下的小样本模型;步骤3.1、初始化小样本模型的参数θ;将输入初始化后的小样本模型中进行内循环训练,得到第i个数据提供方内循环更新后的小样本模型的参数θ'i;步骤3.2、将输入内循环更新后的小样本模型中进行外循环训练,得到更新后的小样本模型的最优参数θ*:步骤4、对最优参数θ*下的小样本模型的性能进行评估,得到全局准确度步骤5、利用式7计算第i个数据提供方的贡献Shapley值φi: 式7中,S表示除去若干个数据提供方的小样本图片集合之外其他所有数据提供方的小样本图片集合,|S|是S中的数据提供方的数量;{Ci}表示包含若干个数据提供方的小样本图片集合;步骤6、定义数据选择的总轮次为Q、当前数据选择的轮数为q,并初始化q=1;第i个数据提供方在第q-1轮数据选择后得到的奖励值定义第q轮数据选择的损失基线bq,并初始化初始bq=0;步骤7、利用式8计算第i个数据提供方在第q轮数据选择中被选择的概率 式8中,是第i个数据提供方在第q-1轮数据选择中的符号函数,为1,表示第i个数据提供方在第q-1轮选择中被选中,为0,表示未被选中;步骤8、依据第q轮数据中被选择的概率,对基模型进行联邦训练,得到联邦训练后的基模型;步骤9、将第i个数据提供方在第Q轮数据选择后得到的奖励值进行降序排序,从而将排名靠前的若干个数据提供方所对应的本地图片数据集合推荐给数据需求方。

全文数据:

权利要求:

百度查询: 合肥工业大学 一种基于元学习和强化学习的图片数据推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。