Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华中科技大学陈加忠获国家专利权

华中科技大学陈加忠获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华中科技大学申请的专利一种图像描述模型的构建方法、图像描述方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119295770B

龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411301962.0,技术领域涉及:G06V10/46;该发明授权一种图像描述模型的构建方法、图像描述方法及设备是由陈加忠;刘鹏飞;秦世坤;王子今;刘富瑞;付子安设计研发完成,并于2024-09-18向国家知识产权局提交的专利申请。

一种图像描述模型的构建方法、图像描述方法及设备在说明书摘要公布了:本发明公开了一种图像描述模型的构建方法、图像描述方法及设备,属于图像处理技术领域;本发明设计了一种包括多层DT模块级联的DT模型,通过多层DT模块级联来保证下一层DT模块中的去噪训练过程受到上一层DT模块预测结果的约束,并在扩散模型自约束的基础上,将预测出的句子结构信息和去噪后的全面语义信息作为增强的约束条件训练去噪过程,是一种基于结构与语义信息条件约束的扩散网络非自回归图像描述方法,解决了现有非自回归图像描述方法中单词之间缺乏依赖信息、生成的句子存在严重的单词重复和缺失的问题,能够快速准确地对图像进行描述。另外,本发明还提出了P个候选模型的多次迭代的优化策略,能够大幅提升样本质量与训练效率。

本发明授权一种图像描述模型的构建方法、图像描述方法及设备在权利要求书中公布了:1.一种图像描述模型的构建方法,其特征在于,包括: S1、提取训练集中每张图像的区域视觉特征,并映射为预设大小的视觉嵌入张量;将视觉嵌入张量编码为视觉上下文信息;采用跨模态检索模型获取该视觉嵌入张量的全面语义信息x0;对x0进行模拟位编码后,进一步进行位置编码和时间编码,得到语义条件y;对x0进行T步加噪操作,得到x0的潜在状态序列x1,x2,…,xT;T为预设总扩散步数;令当前迭代次数epoch=1; S2、从x1,x2,…,xT中按照从前往后的顺序进行L次采样,得到序列z1,z2,…,zL;在后续的训练过程中,将zt作为时间步t下DT模型的输入,且zl先于zl-1被输入到DT模型中;t=L,L-1,…,1;l=L,L-1,…,2;2≤L≤T;DT模型包括I个级联的DT模块;I为正整数;每个所述DT模块均包括:多头自注意力层、交叉注意力层、句子解码器、线性分类器和堆叠的语义编码器; S3、对DT模型执行L个时间步的训练:在每个时间步t下,在第i个DT模块中执行:将y、zt、第i-1个DT模块在时间步t下去噪后的全面语义信息第i个DT模块在上一个时间步下去噪后的全面语义信息进行拼接,得到语义潜在编码后,依次经过堆叠的语义编码器和多头自注意力层,得到自注意力语义先验信息;采用交叉注意力层得到视觉上下文信息和自注意力语义先验信息的交叉注意力信号,并通过句子解码器以交叉注意力信号为约束对自注意力语义先验信息进行解码,得到第i个DT模块在时间步t下去噪后的全面语义信息进而通过线性分类器得到对应的图像描述信息通过最小化与x0的差异损失、以及与对应真实描述信息的差异损失,对第i个DT模块进行训练;其中,i=1,2,…,I;所述图像描述信息包括:句子结构信息; S4、判断epoch是否达到预设迭代次数M,若是,则将当前的DT模型作为最优DT模型;否则,对epoch加一,并转至所述S2,以开始下一次迭代; S5、去除最优DT模型中各DT模块的语义编码器,以及前I-1个DT模块中的线性分类器,并将第j个DT模块的句子解码器的输出端与第j+1个DT模块的多头自注意力层相连,构建包括所述最优DT模型的图像描述模型;j=1,2,…,I-1;在所述图像描述模型的应用过程中,其内第一个DT模块的多头自注意力层的外部输入为随机噪声,且其内每一个DT模块的交叉注意力层的外部输入为待描述图像的视觉上下文信息。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。