买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东省机场集团物流有限公司
摘要:本发明提供一种基于扩散模型的高质量图像合成方法,通过扩散模型逐步添加和去除噪声的方式,将多张前景与背景图像融合转化为具有高度真实感的合成图像;本方法引入一个边缘轮廓修正模型,利用前景的边缘轮廓信息作为提示,稳定对边缘轮廓信息的扩散过程,保证在具有重叠物品情况下合成的图像边缘过度平滑;本方法还引入基于ControlNet的颜色转换模型,通过对前景与背景的颜色信息进行处理,再反馈给ControlNet,进而作为扩散模型解码器的提示,保证合成的图像在具有多张前景图的情况下合成图的颜色更加贴近真实;另外,本发明还能合成具有重叠违禁物品的高质量X光图像,能够合成更加复杂情况下的图像。
主权项:1.一种基于扩散模型的高质量图像合成方法,其特征在于,包括以下步骤:S1:获取背景图像和至少1张前景图像,提取每张前景图像的掩码图;将每张所述前景图像粘贴至所述背景图像中,获取初步融合图像,并提取所述初步融合图像的边缘轮廓图;S2:建立边缘轮廓修正模型,所述边缘轮廓修正模型包括依次连接的自适应编码器和边缘特征融合模块;将每张前景图像的掩码图和初步融合图像的边缘轮廓图共同输入所述自适应编码器,获取轮廓特征图;将所述初步融合图像输入扩散模型的U-Net编码器中,获取中间特征图;将所述轮廓特征图和中间特征图共同输入所述边缘特征融合模块中,获取轮廓融合特征图;S3:建立颜色转换模型,所述颜色转换模型包括依次连接的Lab空间颜色变换模块和ControlNet模块;将所述背景图像,以及每张所述前景图像及其掩码图共同输入Lab空间颜色变换模块,获取合成颜色适应图;将所述合成颜色适应图输入所述ControlNet模块中,获取颜色适应特征图;S4:将所述轮廓融合特征图作为扩散模型的U-Net编码器的提示,将所述颜色适应特征图作为扩散模型的U-Net解码器的提示,获取改进后的扩散模型;将所述初步融合图像输入改进后的扩散模型,获取高质量合成图像。
全文数据:
权利要求:
百度查询: 广东省机场集团物流有限公司 一种基于扩散模型的高质量图像合成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。