北京大学施柏鑫获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京大学申请的专利一种文本辅助的反光去除方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118710533B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410812633.6,技术领域涉及:G06T5/70;该发明授权一种文本辅助的反光去除方法是由施柏鑫;钟灏峰;洪雨辰;翁书晨;梁锦秀设计研发完成,并于2024-06-22向国家知识产权局提交的专利申请。
本一种文本辅助的反光去除方法在说明书摘要公布了:本发明提供一种文本辅助的反光去除方法,包括:输入数据编码、迭代优化控制条件、多条件引导机制和去噪过程4个步骤,每个步骤均通过神经网络中相应设计的模块来实现;通过文本辅助提供语义信息进行反光去除,大大提升实际使用的便利性,并使反光去除的效果超过以往的单张图像的方法;对于扩散模型中遇到的不准确的初始控制条件,能在迭代中进行优化,让扩散模型去除反光后恢复出的背景层保证颜色和结构上的准确性,并且能处理复杂困难的反光场景,如低背景可见度或饱和反光的情况;构建的带有文本提示的数据集,适用文本辅助的反光去除方法的训练和测试,本方法设计科学合理,简单可靠,适合推广。
本发明授权一种文本辅助的反光去除方法在权利要求书中公布了:1.一种文本辅助的反光去除方法,其特征在于,包括:输入数据编码、迭代优化控制条件、多条件引导机制和去噪过程4个步骤,每个步骤均通过神经网络中相应设计的模块来实现: 步骤一、输入数据编码: ①利用混合图像M的强度和梯度来初始化颜色条件:Ic=M和结构条件: ②接着使用颜色编码器εc和结构编码器εs提取所述颜色条件和结构条件的隐空间,分别表示为:yc=εcIc,ys=εsIs; ③使用文本编码器,编码背景层和反光层内容的文本描述,作为正面提示cp和负面提示cn; 步骤二、迭代优化控制条件: 设置一组和时间步相关的系数βt和γt,在对应时间步按照如下公式将初始控制条件和恢复的背景层用系数βt和γt结合得到当前时间步的颜色控制条件和结构控制条件 其中:T*在训练过程中为真值背景层T,在推理阶段中为上一步恢复出来的背景层T0|t; 步骤三、多条件引导机制: 为了缓解扩散模型恢复结果的保真度不高的问题,采用多条件引导机制,分别利用混合图像及其梯度来获得引导反光去除的颜色和结构条件; 步骤四、去噪过程: 去噪过程接受隐空间表示的颜色条件和结构条件上一步的噪声zt以及文本隐空间表示c作为输入,预测下一步的噪声zt-1,从而一步步地恢复出干净的背景层; 颜色条件和结构条件分别输入到两个独立的需要训练的控制网络进行特征提取,上一步的噪声zt输入到一个不用训练的编码网络中进行特征提取,三者的特征再加上文本的特征在解码网络中采用多尺度特征对应相加的方式进行特征融合,最后解码网络输出预测的下一步噪声从而进行逐步去噪操作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学,其通讯地址为:100871 北京市海淀区颐和园路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励