中国石油大学(华东)刘畅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国石油大学(华东)申请的专利一种基于注意力调制和文本重述的文本生成图像方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119991855B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510160113.6,技术领域涉及:G06T11/00;该发明授权一种基于注意力调制和文本重述的文本生成图像方法是由刘畅;邵明文;吕响;孟令壮;宫正义设计研发完成,并于2025-02-13向国家知识产权局提交的专利申请。
本一种基于注意力调制和文本重述的文本生成图像方法在说明书摘要公布了:本发明提出一种基于注意力调制和文本重述的可控文本生成图像方法。该方法能够根据文本描述生成特定布局的语义一致性的高清图像。具体来说,第一阶段,通过大语言模型的视觉概念理解和布局安排能力,根据输入的文本内容生成图像布局信息。第二阶段,利用基于布局的注意力调制机制自适应地调整扩散过程中的注意力图,确保物体生成在给定布局内。第三阶段,利用图像翻译模型再生文本,并设计语义再生监督策略来约束再生文本与输入文本语义对齐,间接更正错误生成区域。大量的实验数据和定性结果表明,本发明在文本生成图像任务上表现出色,同时无需训练的方式显著降低运算复杂度,无需用户给定具体布局信息,便于用户使用。
本发明授权一种基于注意力调制和文本重述的文本生成图像方法在权利要求书中公布了:1.一种基于注意力调制和文本重述的文本生成图像方法,其特征在于能够自适应地调节扩散过程中的注意力图,并且能够利用大语言模型自动生成图像布局,降低用户门槛;并通过文本重述方法纠正不正确的生成区域,包括以下步骤: S1,构建大语言模型提示框架,通过文本提示指导大语言模型自动生成物体标签和布局位置信息;将文本内容通过预训练的文本编码器编码到隐空间,作为生成过程中扩散过程的指导; S2,构建隐空间的稳定扩散模型,该模型能够接收文本编码和布局信息,并将二者压缩到低维度空间;所述步骤S2具体为: S21,首先使用预训练的文本编码器,将文本输入编码为文本向量,用来指导生成扩散过程,这部分表示为: 1 S22,初始化维度为64×64的低维随机噪声,其满足标准的高斯分布,并且将其作为扩散过程的起点; S23,将S12中获得的标签信息映射到同噪声维度的图像上,并用数据库储存起来,这部分表示为: 2 S24,构建预训练的稳定扩散模型,接收S21编码后的文本向量;以S22中初始化的随机纯高斯噪声作为起点,开始扩散过程,逐步去噪,这部分表示为: 3 其中,为总迭代步数;表示第步的噪声特征,为文本向量;为噪声预测网络,与均值系数的选择有关; S3,构建注意力调制模块,将S2中扩散过程中的交叉注意力图进行注意力调制,来增强感兴趣区域的内容生成,以缓解小物体丢失问题;所述步骤S3具体为: S31,捕捉扩散过程中第次迭代步时的交叉注意力层的输入特征,构造三个线性层去获得第次循环中第迭代步的交叉注意力输入量:查询,键,值,这部分表示为: 4 5 6 式中,,分别表示三个不同的线性映射层的权重;为迭代步数,表示循环的轮次,与文本重述的收敛有关; S32,获得交叉注意力图,这部分被表达为: 7 式中表示激活函数,表示转置运算,表示维度,用于对进行归一化处理; S33,构建注意力调制模块,对S32获得的交叉注意力图,根据S23获得的布局信息进行自适应调制,这部分被表达为: 8 9 式中表示包围盒的掩码,表示转置运算,表示第个边界框区域占整个图像的比例; S34,用图像解码器对迭代步为0的隐特征进行解码,从低维度隐空间恢复到像素空间,得到重述轮次的一张高清图像,这部分被表达为: 10 S4,搭建语义文本再生监督网络,对S3调节后S2中的图像利用图像翻译大模型进行重述,和输入的文本进行语义监督,来更新S2每个迭代步的隐特征;所述步骤S4具体为: S41,构建图像翻译大模型,对第轮的生成图像进行文本重述,这部分被表达为: 11 S42,利用与S21相同的文本编码器,对第轮文本重述内容进行编码,这部分被表达为: 12 S43,对重述文本向量和初始文本向量进行高层语义监督,用来间接低隐式地纠正不正确的语义生成内容,这部分被表达为: 13 式中表示余弦相似度计算,表示对数运算,表示重述损失; S44,利用高层语义监督损失,对第轮的扩散过程中第迭代步的隐特征进行更新,并且执行后续的新一轮的扩散过程;这部分被表达为: 14 S5,将迭代后S2最后一步的隐特征,利用预训练的图像解码器恢复为一张图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国石油大学(华东),其通讯地址为:266580 山东省青岛市黄岛区长江西路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励