西北工业大学太仓长三角研究院;西北工业大学深圳研究院;西北工业大学;研祥智慧物联科技有限公司田春伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学太仓长三角研究院;西北工业大学深圳研究院;西北工业大学;研祥智慧物联科技有限公司申请的专利一种基于扩散模型的图像生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119887553B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411892188.5,技术领域涉及:G06T5/60;该发明授权一种基于扩散模型的图像生成方法是由田春伟;夏英豪;高浩洋;唐波;刘欢;刘恩锋;王建升;江广浪设计研发完成,并于2024-12-20向国家知识产权局提交的专利申请。
本一种基于扩散模型的图像生成方法在说明书摘要公布了:本公开实施例公开了一种基于扩散模型的图像生成方法,获取第一干净图像输入扩散模型的扩散过程,得到噪声图像,扩散模型包括Wavelet块并基于人脸五官特征构建扩散模型的损失函数,将噪声图像输入扩散模型的重建过程,对扩散模型进行训练,得到目标扩散模型,获取随机高斯噪声图像,将随机高斯噪声图像输入目标扩散模型的重建过程,得到生成的人脸图像。在扩散模型中引入Wavelet块,可以使用Wavelet块提取第一特征图的第一频率特征,也就是提取噪声图像的高频和低频信息,扩散模型根据高频和低频信息分离高斯噪声,能够有效分离高斯噪声,提高了生成的人脸图像的质量,且基于人脸五官特征构建损失函数,提升了生成的人脸图像的五官细节部分的质量。
本发明授权一种基于扩散模型的图像生成方法在权利要求书中公布了:1.一种基于扩散模型的图像生成方法,其特征在于,包括: 获取人脸数据集中的第一干净图像; 将所述第一干净图像输入扩散模型的扩散过程,在所述扩散过程中逐步添加高斯噪声,得到噪声图像;所述扩散模型包括时间步长嵌入向量生成模块、编码器、解码器,所述解码器包括依次连接的解码器第一模块、解码器第二模块、解码器第三模块、解码器第四模块,所述解码器第一模块包括依次连接的Wavelet块、Attention块、所述Wavelet块、上采样层,所述解码器第二模块包括依次连接的ResBlock块、所述Attention块、所述上采样层,所述解码器第三模块包括依次连接的所述ResBlock块、所述Attention块、所述上采样层,所述解码器第四模块包括依次连接的所述ResBlock块、所述上采样层、所述ResBlock块,所述Wavelet块用于通过离散小波变换模块提取第一特征图的第一频率特征; 基于人脸五官特征构建所述扩散模型的损失函数; 将所述噪声图像输入所述扩散模型的重建过程,基于所述损失函数在所述重建过程中对所述扩散模型进行训练,得到目标扩散模型; 获取随机高斯噪声图像,将所述随机高斯噪声图像输入所述目标扩散模型的所述重建过程,得到生成的人脸图像; 所述将所述第一干净图像输入扩散模型的扩散过程,在所述扩散过程中逐步添加高斯噪声,得到噪声图像,包括: 将所述第一干净图像输入所述扩散模型的所述扩散过程,在所述扩散过程中逐步通过扩散公式添加所述高斯噪声,得到所述噪声图像,所述扩散公式为: , 式中,,,为所述第一干净图像,为经过t步添加所述高斯噪声后的所述噪声图像,为所述高斯噪声,t。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学太仓长三角研究院;西北工业大学深圳研究院;西北工业大学;研祥智慧物联科技有限公司,其通讯地址为:215400 江苏省苏州市太仓市科教新城子冈路27号西北工业大学太仓长三角研究院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励