杭州电子科技大学吴俊谕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利一种基于多尺度网络的自适应分辨率分像素插值方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119996601B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510047128.1,技术领域涉及:H04N7/01;该发明授权一种基于多尺度网络的自适应分辨率分像素插值方法是由吴俊谕;陆宇设计研发完成,并于2025-01-13向国家知识产权局提交的专利申请。
本一种基于多尺度网络的自适应分辨率分像素插值方法在说明书摘要公布了:本发明属于图像视频压缩技术领域,公开了一种基于多尺度网络的自适应分辨率分像素插值方法,包括如下步骤:步骤1:构建模型选择模块;所述模型选择模块根据视频分辨率来选择对应的神经网络模型,所述模型选择模块位于编解码器的帧间预测模块中,其输出的网络模型用于后续基于深度学习的分像素插值方法来生成分像素预测块;步骤2:构建基于空洞卷积的多尺度特征融合网络;步骤3:训练基于空洞卷积的多尺度特征融合网络;步骤4:构建基于深度学习的分像素预测模块。本发明根据视频分辨率来选择对应的神经网络模型,网络模型用于后续分像素插值任务得到分像素预测块,提升了分像素预测准确性。
本发明授权一种基于多尺度网络的自适应分辨率分像素插值方法在权利要求书中公布了:1.一种基于多尺度网络的自适应分辨率分像素插值方法,其特征在于,包括如下步骤: 步骤1:构建模型选择模块;所述模型选择模块根据视频分辨率来选择对应的神经网络模型,所述模型选择模块位于编解码器的帧间预测模块中,其输出的网络模型用于后续基于深度学习的分像素插值方法来生成分像素预测块;使用1080p、720p和240p分辨率的YUV视频分别训练得到三个基于空洞卷积的多尺度特征融合的网络模型:A、B和C; 步骤2:构建基于空洞卷积的多尺度特征融合网络; 步骤2所述基于空洞卷积的多尺度特征融合网络由浅层特征提取,深层特征提取和重建这三个阶段构成,用Bin表示网络的输入,Bout表示网络的输出,模型使用非线性映射均为LeakyReLU,其参数为默认值;所述浅层特征提取通过3x3卷积和非线性映射将输入图像块映射到高维特征空间,首先经过一次卷积和非线性映射操作,最后再进行非线性映射、卷积和非线性映射的操作; 使用1x1的卷积作为重建阶段,表示为: Bout=Conv1Fh2, 9其中卷积操作的输入通道数为32,输出通道数为1,卷积核大小为1; 步骤3:训练基于空洞卷积的多尺度特征融合网络; 三种1080p、720p和240p分辨率模型:A、B、C,分别使用Cactus_1920x1080_50.yuv、FourPeople_1280x720_60.yuv、BlowingBubbles_416x240_50.yuv视频训练得到; 使用HEVC的参考软件HM来生成训练集数据,其编码配置采用lowdelay_P_main,并更改以下选项:关闭Merge Mode,MaxCUWidth=16,MaxCUHeight=16,MaxPartitionDepth=2,QuadtreeTULog2MaxSize=4,QPoffset=0,编码器压缩视频后,挑选出其中运动矢量是分数精度的编码块,提取出以下数据:编码块对应图像的POC,编码块在图像中的位置,编码块的大小,参考块对应图像的POC,参考块在图像中的位置,参考块的大小,运动矢量的整数部分和分数部分,根据上述信息从重建视频中提取整像素块并将其向四周填充6像素大小作为Bref,从目标视频中提取出编码块作为Bcur,构成训练样本对Xi,Yi=Bref,Bcur,为每一个分像素位置制作一组训练集,为不同分辨率模型制作一套训练集; 步骤4:构建基于深度学习的分像素预测模块。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。