武汉大学张乐飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉大学申请的专利一种指代视频目标分割方法、装置、设备及可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116612416B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310624309.7,技术领域涉及:G06V20/40;该发明授权一种指代视频目标分割方法、装置、设备及可读存储介质是由张乐飞;兰猛设计研发完成,并于2023-05-30向国家知识产权局提交的专利申请。
本一种指代视频目标分割方法、装置、设备及可读存储介质在说明书摘要公布了:本申请涉及一种指代视频目标分割方法、装置、设备及可读存储介质,包括对目标视频序列和目标语言描述内容进行特征提取,得到图像特征、句子级文本特征和单词级文本特征;对上述特征进行特征提取和帧级空间信息提取,得到图像帧特征和帧级实例嵌入;对帧级实例嵌入进行时空维度合并且进行时空一致性建模和时空表征学习,生成目标实例特征,并对其和视频级查询嵌入进行时空信息聚合处理,生成视频级实例嵌入;对视频级实例嵌入进行线性变换得到分类概率和条件卷积核,对条件卷积核和图像帧特征进行卷积运算得到多个掩码预测序列;基于分类概率从多个掩码预测序列中筛选出目标掩码预测序列作为视频目标分割结果,有效提升了时空一致性和准确性。
本发明授权一种指代视频目标分割方法、装置、设备及可读存储介质在权利要求书中公布了:1.一种指代视频目标分割方法,其特征在于,包括以下步骤: 对目标视频序列和目标语言描述内容分别进行特征提取,得到图像特征、句子级文本特征和单词级文本特征; 对图像特征和单词级文本特征进行特征提取,得到图像帧特征,并对图像特征和句子级文本特征进行帧级空间信息提取,生成帧级实例嵌入; 对帧级实例嵌入进行时空维度合并,并对合并后的帧级实例嵌入进行时空一致性建模和时空表征学习,以生成目标实例特征; 对目标实例特征和预设的视频级查询嵌入进行时空信息聚合处理,生成视频级实例嵌入; 对视频级实例嵌入进行线性变换,得到分类概率和条件卷积核,并对条件卷积核和图像帧特征进行卷积运算,生成多个掩码预测序列; 基于分类概率从多个掩码预测序列中筛选出目标掩码预测序列作为视频目标分割结果; 其中,所述对合并后的帧级实例嵌入进行时空一致性建模和时空表征学习,以生成目标实例特征,包括: 将位置编码添加至合并后的帧级实例嵌入,形成新的帧级实例嵌入; 基于实例编码器对新的帧级实例嵌入进行时空一致性建模和时空表征学习,生成目标实例特征,所述实例编码器中包括多头自注意力模块、相加模块、归一化模块以及前馈网络; 所述对目标实例特征和预设的视频级查询嵌入进行时空信息聚合处理,生成视频级实例嵌入,包括: 通过随机初始化生成一视频级查询嵌入; 基于实例解码器对目标实例特征和视频级查询嵌入进行时空信息聚合处理,生成视频级实例嵌入,所述实例解码器包括多头互注意力模块、相加模块、归一化模块、多头自注意力模块以及前馈网络。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430000 湖北省武汉市武昌区珞珈山;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励