当前位置 : 首页 > 专利喜报 > 电子科技大学(深圳)高等研究院吕继纲获国家专利权

电子科技大学(深圳)高等研究院吕继纲获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉电子科技大学(深圳)高等研究院申请的专利文本生成视频方法、装置及存储介质获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN119697456B 。

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202411758603.8，技术领域涉及：H04N21/854；该发明授权文本生成视频方法、装置及存储介质是由吕继纲;桂子钦;段立新;李文;黄野设计研发完成，并于2024-12-03向国家知识产权局提交的专利申请。

本文本生成视频方法、装置及存储介质在说明书摘要公布了：本发明公开了一种文本生成视频方法、装置及存储介质，该方法包括步骤：S11：基于输入文本提示生成目标视频帧的第一噪声潜码；S12：基于该输入文本提示和该第一噪声潜码，生成该输入文本提示中每个主体标记的交叉注意力图；S13：对该交叉注意力图进行高斯滤波，使该交叉注意力图平滑；S14：基于该交叉注意力图更新该第一噪声潜码，生成第二噪声潜码，并将该第一噪声潜码替换成该第二噪声潜码；S15：用有帧间注意力控制的扩散模型对该第二噪声潜码去噪；S16：判断采样总步数是否达到预定的步数，且所有主体标记是否达到一个设定的最小注意力阈值，如未达到，则执行步骤S12；S17：基于该第二噪声潜码输出该目标视频帧。本发明的文生视频方法保证了语义准确。

本发明授权文本生成视频方法、装置及存储介质在权利要求书中公布了：1.一种文本生成视频方法，其特征在于，包括步骤： S11：基于输入文本提示生成目标视频帧的第一噪声潜码，具体包括：从标准高斯分布中随机采样第一个潜码Zt1；对所述Zt1进行Δt步的DDIM反向步骤，得到Zt'1；定义全局运动方向，计算并应用每个帧的全局平移向量k，将构造的运动流1:m应用于所述Zt'1，得到相应的序列Zt'1:m，即对第一帧Zt'1进行m步逐步加强平移的变形操作，得到m帧的Zt'1:m；对变形后的潜码进行DDPM前向步骤，得到最终m帧的初始噪声潜码序列Zt1:m，基于该Zt1:m得到所述第一噪声潜码Zt； S12：基于所述输入文本提示和所述第一噪声潜码，生成所述输入文本提示中每个主体标记的交叉注意力图，其中，所述交叉注意力图是由多个分辨率为16*16的注意力图进行平均而来，所述交叉注意力图包含多个注意力图，每个注意力图对应于所述每个主体标记，所述交叉注意力图的矩阵的一个元素的值表示一个主体标记出现在一个图像块中的概率； S13：对所述交叉注意力图进行高斯滤波，使所述交叉注意力图平滑； S14：基于所述交叉注意力图更新所述第一噪声潜码，生成第二噪声潜码，并将所述第一噪声潜码替换成所述第二噪声潜码； S15：用有帧间注意力控制的扩散模型对所述第二噪声潜码去噪； S16：判断采样总步数是否达到预定的步数，且所有主体标记是否达到一个设定的最小注意力阈值，如达到，则执行步骤S17；反之，如未达到，则执行步骤S12； S17：基于所述第二噪声潜码输出所述目标视频帧。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人电子科技大学(深圳)高等研究院，其通讯地址为：518000 广东省深圳市龙华区观澜街道新澜社区观光路1301-78号银星智界二期2号楼；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

电子科技大学(深圳)高等研究院吕继纲获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务