Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州电子科技大学;先进计算与关键软件(信创)海河实验室陈小雕获国家专利权

杭州电子科技大学;先进计算与关键软件(信创)海河实验室陈小雕获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州电子科技大学;先进计算与关键软件(信创)海河实验室申请的专利一种基于改进型ViT-Unet的图像修复方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119624834B

龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411741015.3,技术领域涉及:G06T5/77;该发明授权一种基于改进型ViT-Unet的图像修复方法是由陈小雕;黄臻;陈鸿宇;幸洋晨;陶秀挺;吴文设计研发完成,并于2024-11-29向国家知识产权局提交的专利申请。

一种基于改进型ViT-Unet的图像修复方法在说明书摘要公布了:本发明公开了一种基于改进型ViT‑Unet的图像修复方法。本发明步骤:阶段一、数据收集与预处理,提取多样化的图像数据集。阶段二、通过改进型ViT模块与动态权重的门控卷积相结合,实现高效的特征提取与下采样,作为U‑net结构的编码器;阶段三、利用改进型ViT模块与PixelShuffle的协同作用,进行特征上采样与图像重建,作为U‑net结构的解码器;阶段四、结合增强的深度学习策略,通过对学习率进行调整,对模型进行训练和优化,确保其在不同场景下的适应性和表现。本发明的应用场景广泛,适用于医疗图像、卫星图像以及日常拍摄照片的修复,能够显著提升修复任务的处理速度和结果的质量,对于提高图像处理领域的技术水平具有重要价值。

本发明授权一种基于改进型ViT-Unet的图像修复方法在权利要求书中公布了:1.一种基于改进型ViT‑Unet的图像修复方法,其特征在于,利用增强的门控卷积结构,实现对图像局部和全局信息的有效融合,通过动态调整卷积特征和门控机制,确保重要特征保留的同时抑制噪声,具体步骤包括以下几个阶段: 阶段一、数据收集与预处理,提取多样化的图像数据集; 阶段二、将改进型ViT模块与动态权重的门控卷积相结合,作为U‑net结构的编码器,实现高效的特征提取与下采样; 阶段三、利用改进型ViT模块与PixelShuffle的协同作用,进行特征上采样与图像重建,作为U‑net结构的解码器; 阶段四、结合增强的深度学习策略,通过对学习率进行调整,对模型进行训练和优化,确保其在不同场景下的适应性和表现; 所述阶段二具体实现如下: 2‑1.对U‑net编码器的每层结构进行改进,原ViT模块采用一个三明治结构,由两个FFN块包裹一个级联注意力层的结构,原公式如下: 添加门控卷积后的公式如下: 其中,xi为输入特征图,xi+1为输出特征图,g为门控信号,为全连接层,为多个全连接层组成的全连接块,为级联注意力层,⊙为逐元素相乘操作,[:,:c,:,:]表示从张量中提取样本的前c个通道; 2‑2.在所述ViT模块中引入VSS块替换FFN块,形成一个由两个VSS块包裹一个级联注意力层的结构,每个VSS块由多个VSS层组成;VSS层通过将选择机制集成到其状态模型空间中并使其能够应用于视觉领域,引入VSS块后的改进型ViT模块的具体实现如下:通过VSS层中的SS2D模块进行扫描生成序列,根据序列中每个token的相关性有效地决定传播信息还是丢弃信息,通过建模视觉状态空间,提供对连续图像帧和全局上下文的动态建模能力,其公式变为: 其中,为第i层视觉状态空间层,为由多个视觉状态空间层组成的VSS块,该三明治结构由两个VSS块提供灵活的适应能力,在输入的最开始阶段提供对视觉信息的全面建模、调整权重和进行知识融合,再由级联注意力机制进行通道拆分并级联,实现高效的特征提取和融合; 所述的阶段三具体实现如下: 对U‑net解码器做出改进,通过添加卷积层将Pixelshuffle上采样与改进型ViT模块的注意力机制更好结合,使得PixelShuffle能够在上采样的同时,利用改进型ViT模块对全局上下文的建模能力,充分利用输入图像的特征;具体实现如下:首先添加了一个1×1卷积层来处理输入特征图,将具有in_channels个通道数的输入特征图xi,通过卷积运算变为具有inter_channels个通道数的中间特征图xi′,该inter_channels由预设的上采样因子计算得出,再进行PixelShuffle上采样,具体实现如下: xi′=Conv2Dxi,in_channels→inter_channels,kernel_size=1,stride=1,padding=0,bias=Falsey=PixelShufflexi',upscale_factor=2其中,xi为输入特征图,in_channels为输入通道数,xi'为中间特征图,inter_channels为中间通道数,upscale_factor为上采样因子,kernel_size为卷积核大小,stride为步长,padding为填充,bias表示偏置项,PixelShuffle表示上采样方法,y表示上采样结果; 将编码后的特征通过解码器逐层上采样,恢复至输入图像的原始分辨率,每一层的解码器由PixelShuffle上采样与改进型ViT模块联合使用,并通过一个通道融合模块整合来自编码器中的信息,解码器逐层恢复特征至64×64、128×128、256×256,并在通道融合模块中分别与来自编码器中经过改进型ViT处理后的64×64、128×128、256×256大小的特征进行融合,最终生成高分辨率的修复图像。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学;先进计算与关键软件(信创)海河实验室,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。