Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东南大学路小波获国家专利权

东南大学路小波获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东南大学申请的专利基于关键点引导文生图扩散模型的人脸生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119762610B

龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411894468.X,技术领域涉及:G06T11/00;该发明授权基于关键点引导文生图扩散模型的人脸生成方法是由路小波;王幸设计研发完成,并于2024-12-20向国家知识产权局提交的专利申请。

基于关键点引导文生图扩散模型的人脸生成方法在说明书摘要公布了:本发明公开了一种基于关键点引导文生图扩散模型的人脸生成方法,首先收集数据信息,将人脸图像、文本描述信息和人脸关键点构成训练数据对,利用文本编码器对文本描述信息进行编码并转换为嵌入向量,利用隐空间编码器将人脸关键点图像信息映射到隐式空间;将高斯噪声图的隐式空间张量和人脸关键点图像信息的隐式空间张量进行拼接;建立隐式扩散模型并训练,对拼接的隐式空间张量不断迭代去噪,获取与关键点和文本描述信息对应的人脸图像,利用热力图引导下的去噪损失模块为关键点条件分配额外的训练注意力,使用隐空间解码器将隐式空间中的去噪结果映射到像素空间,最终重建出高生成质量和高图像与文本描述信息一致性的人脸图像。

本发明授权基于关键点引导文生图扩散模型的人脸生成方法在权利要求书中公布了:1.基于关键点引导文生图扩散模型的人脸生成方法,其特征在于,至少包括如下步骤: S1、收集数据并处理:收集不同人脸的图像信息,所述图像信息至少包括文本描述信息和人脸关键点,将对应的人脸图像、文本描述信息和人脸关键点构建出人脸图像‑文本描述信息‑人脸关键点的训练数据对; S2、文本描述信息处理:利用文本编码器对人脸图像对应的文本描述信息进行编码并转换为嵌入向量; S3、人脸关键点图像处理:利用隐空间编码器将人脸关键点图像信息映射到隐式空间,得到人脸关键点图像信息的隐式空间张量; S4、隐式空间张量拼接:初始化高斯噪声图,将其映射到隐式空间得到高斯噪声图的隐式空间张量,将高斯噪声图的隐式空间张量与步骤S3获得的人脸关键点图像信息的隐式空间张量进行拼接; S5、建立隐式扩散模型:所述隐式扩散模型采用预训练的Stable Diffusion 2.0,是UNet结构的深度神经网络,通过多步的逆扩散过程,得到符合训练数据分布的样本; S6、模型训练:对步骤S5建立的隐式扩散模型进行模型训练,并对拼接的隐式空间张量不断迭代去噪,将预测的噪声和真实噪声做差,该差值经隐空间解码器解码后得到差值图,对该差值图进行关键点检测得到注意力热力图,该注意力对关键点条件分配额外的训练注意力; S7、结果输出:初始化高斯噪声图,利用步骤S6训练好的去噪网络,根据人脸关键点和文本描述信息,逐步预测当前步所加的噪声,采用隐式采样算法对噪声图不断迭代去噪,使用隐空间解码器将隐式空间去噪结果映射到像素空间,最终重建出与人脸关键点和文本描述信息一致的人脸图像。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211189 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。