中国科学技术大学庄连生获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学技术大学申请的专利文本引导的零样本透明图层及分层图像生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120070638B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510202270.9,技术领域涉及:G06T11/00;该发明授权文本引导的零样本透明图层及分层图像生成方法是由庄连生;郭欣然设计研发完成,并于2025-02-24向国家知识产权局提交的专利申请。
本文本引导的零样本透明图层及分层图像生成方法在说明书摘要公布了:本发明涉及图像处理领域,具体涉及一种文本引导的零样本透明图层及分层图像生成方法,分层图像生成方法包括:输入全局图像文本提示、目标图像尺寸及层文本提示到前景位置信息生成模型,得到前景位置信息;为每个层文本提示生成第一目标图像;根据所有第一目标图像的透明通道,生成软分割掩码;叠加所有第一目标图像,并编码到潜在空间,得到前景叠加潜在特征;随机采样高斯噪声作为初始背景潜在特征。根据软分割掩码,在迭代式去噪过程中混合前景叠加潜在特征与初始背景潜在特征,得到全局图像潜在特征,并解码为第二目标图像。本发明对每个主体对象的位置进行精准控制,增强了模型的图像布局能力;免去了模型训练的步骤,极大节省计算资源。
本发明授权文本引导的零样本透明图层及分层图像生成方法在权利要求书中公布了:1.一种文本引导的零样本透明图层生成方法,其特征在于,所述方法用于根据输入的层文本提示、目标图像尺寸及前景位置信息,生成尺寸为目标图像尺寸的第一目标图像,所述层文本提示描述所述第一目标图像的内容,所述第一目标图像包括一个主体对象及透明背景,所述前景位置信息表示主体对象在第一目标图像中的位置,所述方法包括: 接收层文本提示、目标图像尺寸及前景位置信息; 将层文本提示输入文本编码器,得到文本提示嵌入; 根据前景位置信息生成二值掩码; 根据目标图像尺寸创建透明图像,并通过透明图像编码器将透明图像编码到潜在空间,得到透明图像潜在特征;其中,第一目标图像、二值掩码、透明图像的尺寸相同; 在潜在空间,随机采样高斯噪声作为初始噪声潜在特征; 迭代预设的第一数量个时间步,在每个时间步,根据透明图像潜在特征及二值掩码,修改上个时间步输出的噪声潜在特征,得到修正噪声潜在特征;根据二值掩码设定交叉注意力矩阵,通过调整文本提示嵌入与修正噪声潜在特征之间的交叉注意力关联度,对修正噪声潜在特征执行去噪,得到当前时间步输出的噪声潜在特征;其中,第一个时间步中以初始噪声潜在特征作为上个时间步输出的噪声潜在特征; 将最后一个时间步输出的噪声潜在特征输入透明图像解码器,得到第一目标图像; 其中,根据透明图像潜在特征及二值掩码,修改上个时间步输出的噪声潜在特征,得到修正噪声潜在特征的步骤包括: 将透明图像潜在特征添加第一图像噪声,得到透明加噪背景潜在特征,并根据透明加噪背景潜在特征及二值掩码,修改上个时间步输出的噪声潜在特征,得到修正噪声潜在特征;其中,第一图像噪声为高斯噪声,且每个时间步添加的第一图像噪声的强度小于上个时间步添加的第一图像噪声的强度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励