买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海交通大学
摘要:一种基于参数冻结的移动端新类别学习与轻量更新迁移方法,先在服务器端对图像分类模型中的特征提取器的模型参数完全冻结,再对图像分类模型中的旧类别分类头的模型参数选择性冻结后发送至待执行增量训练的移动设备;在移动端对新旧类别分类头进行基于预训练的再次选择性冻结后,利用本地采集的新类别数据进行轻量级模型更新,最终完成分类头的更新部分跨设备传输。本发明能够在保持学习新类别能力的同时,减少旧类别数据上发生的遗忘,并降低训练的内存开销,还使得训练能够在短时间进行且模型更新迁移量非常轻量,整体解决了在计算、通信资源受限的移动设备上,对出现的少量新类别进行学习并且向其他执行相同任务的移动设备传递模型更新的问题。
主权项:1.一种基于参数冻结的移动端新类别学习与轻量更新迁移方法,其特征在于,先在服务器端对图像分类模型中的特征提取器的模型参数完全冻结,再对图像分类模型中的旧类别分类头的模型参数选择性冻结后发送至待执行增量训练的移动设备;在移动端对新旧类别分类头进行基于预训练的再次选择性冻结后,利用本地采集的新类别数据进行轻量级模型更新,最终完成分类头的更新部分跨设备传输;所述的完全冻结是指:对于包含特征提取器、旧类别分类头和新类别分类头的图像分类模型Θ,除分类头外的所有浅层部分,将在新类别学习过程中保持不变;所述的旧类别分类头的模型参数选择性冻结是指:利用服务器保存的旧类别训练数据的随机采样子集Df,计算对于旧类别分类头的费舍尔信息矩阵的对角线值f,对于每个参数j根据其在费舍尔信息矩阵的对角线元素的对应值按比例α冻结所有对应值fj较大的元素,其中:0≤α<1;所述的发送是指:服务器创建和模型旧类别分类头参数对应的位掩码,使用位掩码对冻结的参数进行记录并发送至待执行增量训练的移动设备,其中冻结的参数的对应位掩码设置为0,否则设置为1;所述的基于预训练的再次选择性冻结是指:移动设备使用新类别数据对包含选择性冻结的旧类别分类头和未冻结的新类别分类头的图像分类模型进行快速训练,根据每个参数j在快速训练过程中的改变量的绝对值决定是否需冻结该参数。
全文数据:
权利要求:
百度查询: 上海交通大学 基于参数冻结的移动端新类别学习与轻量更新迁移方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。