Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜南京理工大学李俊获国家专利权

恭喜南京理工大学李俊获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜南京理工大学申请的专利一种图文融合的新物体AI生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119338947B

龙图腾网通过国家知识产权局官网在2025-05-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411265710.7,技术领域涉及:G06T11/60;该发明授权一种图文融合的新物体AI生成方法是由李俊;熊泽仁;杨健设计研发完成,并于2024-09-10向国家知识产权局提交的专利申请。

一种图文融合的新物体AI生成方法在说明书摘要公布了:本发明公开了一种图文融合的新物体AI生成方法,旨在结合物体文本与物体图像生成不同的物体图像;该方法的输入是一个原始的物体图像和一个要融合的物体文本名称,输出的是两个物体平滑融合的新物体图像,融合生成的物体不仅具有原始的物体图像的布局或姿态,而且包含文本物体的特征信息。本发明可以立足于现实中存在的物体进行操作,从现实存在的物体出发进行融合,不局限于虚拟或合成的数据,而是可以从真实的物体图像出发,该方法更加贴近现实世界,使得生成的图像更具有真实感和实用性。

本发明授权一种图文融合的新物体AI生成方法在权利要求书中公布了:1.一种图文融合的新物体AI生成方法,其特征在于,根据原始物体图像和物体文本,融合生成新物体图像,该方法包括如下步骤:步骤1、输入图像文本编码器ε·,物体图像OI,物体文本OT,空文本ON,反演步数T,自注意力注入步长i,采样噪声∈t,预训练的U-Net模型∈θ·,尺度因子α;步骤2、特征提取,利用编码器ε·提取OI的隐含特征z0=εOI,空文本ON的文本编码τN=εON,以及物体文本OT的文本编码τ=εOT;步骤3、通过公式:对进行反演得到其中表示反演得到的最终第t步的噪声隐含特征,是采样器定义的第t步方差;步骤4、进行保真度与可编辑性的平衡,以作为噪声隐含特征的起始点,通过公式 进行去噪,在去噪过程中使用l2范数损失优化∈t+1使得逼近反演过程中的提高保真性,并使用KL散度损失来衡量∈t+1与高斯分布的距离,同时处理保真度和可编辑性,得到最终优化后的序列其中t∈{0,…,T};是一个预训练的U网络结构,其中包含自注意力模块,是在∈θ·中从派生的问询、键、价值特征向量,d是价值特征向量的维度;步骤5、定义融合去噪过程,以作为噪声隐含特征的起始,通过公式进行去噪得到融合图像Oα,i,其中α是缩放交叉注意力层的尺度因子,i是自注意力注入步数;步骤6、∈θzt,t,τ,α,i是一个预训练的U网络结构,其中包含注入自注意力层和尺度交叉注意力层;引入自注意力注入步数i,0≤i≤T,注入自注意力层定义为其中 其中是在∈θ·中从zt派生的查询和键特征向量,d是价值向量的维度,是正常去噪过程中的自注意力图;引入一个尺度因子α∈[0,2]控制融合过程,尺度交叉注意力层定义为其中是问询特征,是文本编码τ=εOT派生的查询和键特征向量,d是价值向量的维度;步骤7、定义相似性距离计算如下:图像OI与步骤5融合生成图像Oα,i之间的相似度表示为Isimα,i=dOI,Oα,i;文本OT与步骤5融合生成图像Oα,i之间的相似度表示为Tsimα,i=dOT,Oα,i,其中d·,·为图像文本的相似性距离函数;步骤8、使用步骤7定义,当α=1,Isimi=dOI,Oα=1,i;自适应调整步骤6注入自注意力的注入步数:初始化i更新方法如下, 其中与是根据观察设置的软阈值;更新后得到i=i*;步骤9、根据步骤8得到的i=i*,使用步骤7定义,进而简化为,Isimα=dOI,Oα,i=i*和Tsimα=dOT,Oα,i=i*,其中d·,·表示文本图像与图像之间的相似距离;定义融合得分函数Fα如下: 其中β为权重因子,参数k是为了缓解由于文本和图像模态差异导致的高Isimα和低Tsimα之间的尺度不一致,从而确保它们的尺度平衡;步骤10、通过步骤9定义的融合得分函数作为目标函数,基于步骤5定义的融合去噪过程使用黄金分割搜索法来确定α的最优值α=α*;步骤11、通过步骤8、10找到最优的i*与α*,输入文生图模型生成融合最优的视觉图像Oα*,i*。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市孝陵卫200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。