基于注意力机制和迁移学习的视频图像压缩方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浙江工商大学

摘要：本发明公开了一种基于注意力机制和迁移学习的视频图像压缩方法，属于视频图像编解码领域。本发明提供的方法在基础模型的残差数据编码器之后增加了一个通道注意力模块和一个空间注意力模块，用于实现码率控制。第一阶段的学习针对基础模型，获得若干组对应不同失真码率平衡因子值的网络参数集；在第二阶段，以迁移学习的方式，对基础模型的每一组参数集学习若干组仅包含通道注意力、空间注意力和残差数据解码器的各个网络层次的轻量级参数集。采用本发明提供的基于注意力机制和迁移学习的视频压缩方法能以较小的存储代价保存较多对应不同失真码率平衡因子值的模型参数集，从而为精细化的码率控制提供可能性。

主权项：1.一种基于注意力机制和迁移学习的视频图像压缩方法，其特征在于，该方法包括：S1、采用DVC视频编码系统作为基础模型，该基础模型包括以深度神经网络实现的运动估计、运动向量编码和解码、运动补偿、残差数据编码和解码模块，以监督学习的方式对所述基础模型进行第一阶段的学习，确定所述基础模型中各个模块的网络参数；且在第一阶段学习过程中，设t代表当前帧，为t之前的相邻帧经压缩编码后解码还原的图像，对每一个训练样本将和t输入到所述基础模型中，经编码和解码后输出当前帧t对应的解码图像再按如下的损失函数公式计算损失其中，代表t和之间的误差，R为与码率相关的代价；λ为用于平衡失真和码率的权重参数；批量加载训练样本集中的所有训练样本，以最小化所有训练样本的损失函数之和为目标，以反向传播的方式更新调整基础模型的各个网络层次的参数，直至第一阶段的学习过程收敛，得到一组对应基础模型的第一网络参数集；S2、在基础模型的残差数据编码器之后增加用于实现码率控制的一个通道注意力模块和一个空间注意力模块，从而得到优化模型；以迁移学习的方式对所述优化模型进行第二阶段的学习，且设为第一阶段学习过程中设置权重参数＝λ1学习所得的第一网络参数集，第二阶段学习将基础模型中的运动估计模块、运动向量编码和解码模块、运动补偿模块、残差数据编码器的各个网络层次的参数迁移至所述优化模型中，且将这些模块的网络参数固化为中的值，仅学习通道注意力模块、空间注意力模块和残差数据解码器中各个网络层次的参数；且在第二阶段的学习过程中，训练样本输入到优化模型后，先由与基础模型相同的运动估计模块、运动向量编码和解码模块、运动补偿模块和残差数据编码器处理后输出对应输入样本的特征图t，特征图t经通道注意力模块处理形成修正特征图修正特征图进一步经空间注意力模块处理形成修正特征图最后对修正特征图进行取整运算和熵编码形成最终的编码码流；然后在解码端，对编码码流进行熵解码后输入到残差数据解码器，由残差数据解码器输出对应t的解码图像再按S1中所述的损失函数公式对指定的权重参数λ取值λ2计算损失批量加载训练样本集中的所有训练样本，以最小化所有训练样本的损失函数之和为目标，以反向传播的方式更新调整所述优化模型中通道注意力模块、空间注意力模块和残差数据解码器的各个网络层次的参数，直至第二阶段的学习过程收敛，得到一组第二网络参数集；S3、在第一阶段和第二阶段的学习中设定不同的权重参数λ的取值组合，最终得到若干组第二网络参数集，每一组第二网络参数集对应两个学习阶段中一组权重参数λ的取值组合λ1和λ2；对于任意给定的码率限制，从所有第二网络参数集中选择一组在该码率限制下具有最小平均失真的第二网络参数集，用于供所述优化模型进行编解码操作。

全文数据：

权利要求：

百度查询：浙江工商大学基于注意力机制和迁移学习的视频图像压缩方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种具有降噪功能的数控铣床

下一篇：一种管件加工放管横移动片调节机构

相关技术

一种具有降噪功能的数控铣床

一种管件加工放管横移动片调节机构

一种纺织用织布印花包装装置

一种专用于钣金壳体冲压成型的冲压模具

一种大白菜种子的储存装置

一种磨浆机加载加压装置

炮控系统性能验证装置

一种带导向防滑的除夹钳装置

一种用于卧式加工中心的毛坯校平工装

复音口琴

一种汽车B立柱下内腔膨胀胶

一种装配式钢结构桥梁后张法轻型T梁预制台座

学习相关技术

基于模仿学习和强化学习的码率自适应选择方法_浙江工业大学_202410602512.9

诊断辅助装置、学习装置、诊断辅助方法、学习方法及程序_株式会社尼康_201980018367.7

机器学习辅助的图像预测_苹果公司_202410716169.0

基于技能学习和自注意力的围捕多智能体强化学习方法_清华大学深圳国际研究生院_202410620791.1

基于深度学习的DDoS攻击检测方法_安徽省大数据中心_202410471043.1

一种人工智能家用学习桌_深圳市美格智联信息技术有限公司_202323618337.2

在卷积神经网络中学习步长_谷歌有限责任公司_202280076273.7

基于机器学习的农田杂草检测方法及系统_滨州市农业科学院_202411036486.4

基于深度学习的人群密度估计方法_哈尔滨师范大学_202410043296.9

基于深度学习的OCR错漏检测方法_山东环球软件股份有限公司_202410718058.3

视频相关技术

视频处理方法、装置和视频处理芯片_深圳市欧冶半导体有限公司_202410857635.7

船舶视频智能监控系统_广州中海电信有限公司_202323288348.9

自定义合集视频_威尔乌集团_202080047828.6

视频编码方法、视频解码方法、装置及电子设备_北京达佳互联信息技术有限公司_202410526225.4

视频帧存储方法、视频播放器、终端及可读存储介质_深圳市锐明技术股份有限公司_202410674406.1

一种录制实训教学视频的音、视频采集装置_南京数字谷数码科技有限公司_202322917136.6

视频平台设备、视频会议实现方法、电子设备及存储介质_苏州科达特种视讯有限公司_202410844536.5

视频合成系统、视频合成方法及计算机可读存储介质_弗劳恩霍夫应用研究促进协会_202011420006.6

一种视频处理设备的远程控制方法及远程视频处理设备_南京跃马信息科技有限公司_202410670496.7

视频分割网络模型的训练方法、视频分割方法及相关设备_浙江大华技术股份有限公司_202010626881.3

图像相关技术

图像处理装置和图像处理方法_株式会社御牧工程_202380017725.9

图像处理装置、图像处理方法及记录介质_富士胶片株式会社_202410212626.2

图像解码设备、图像编码设备和发送设备_LG电子株式会社_202410785384.6

图像显示装置、图像显示方法以及记录介质_富士胶片株式会社_202410212624.3

图像处理方法、图像处理装置、设备以及存储介质_深圳市商汤科技有限公司_202410490964.2

一种图像处理方法、图像处理芯片_上海为旌科技有限公司_202410132844.5

图像分割、图像分割模型训练的方法及设备_阿里巴巴达摩院(杭州)科技有限公司_202410453022.7

图像传感器_三星电子株式会社_202410191551.4

图像转换方法_香港科技大学_202410215988.7

图像读取装置_精工爱普生株式会社_202211180640.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于注意力机制和迁移学习的视频图像压缩方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务