北京鹍智科技有限责任公司曹文钰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京鹍智科技有限责任公司申请的专利一种发现音视频播出内容中异态的人工智能识别的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120877191B 。
龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511042110.9,技术领域涉及:G06V20/40;该发明授权一种发现音视频播出内容中异态的人工智能识别的方法是由曹文钰;彭建川;奚新明设计研发完成,并于2025-07-28向国家知识产权局提交的专利申请。
本一种发现音视频播出内容中异态的人工智能识别的方法在说明书摘要公布了:本发明提供一种发现音视频播出内容中异态的人工智能识别的方法,涉及视频处理技术领域,所述方法包括:将待处理视频进行解码,获得多个待处理视频帧,并进行特征提取处理,获得时空特征图;根据时空特征图,获得分区时空特征向量;将分区时空特征向量输入编码模型,获得综合时空特征信息;将综合时空特征信息输入分类判别模型,获得异态类型识别结果。根据本发明,可通过多个层级以及多个分区的特征提取处理,有效地捕捉视频中的局部信息和全局信息,有助于对视频内容进行准确理解,从而实现对视频的连续多帧的异态类型识别,并可适用于更多种场景和异态类型,提升识别准确性和适用性。
本发明授权一种发现音视频播出内容中异态的人工智能识别的方法在权利要求书中公布了:1.一种发现音视频播出内容中异态的人工智能识别的方法,其特征在于,包括: 将待处理视频进行解码,获得多个待处理视频帧; 对连续的第一预设数量个待处理视频帧进行特征提取处理,获得多个特征通道的时空特征图; 根据所述时空特征图,获得与所述时空特征图的多个分区对应的分区时空特征向量; 将多个分区对应的分区时空特征向量输入编码模型进行处理,获得综合时空特征信息; 将所述综合时空特征信息输入分类判别模型进行处理,获得异态类型识别结果; 对连续的第一预设数量个待处理视频帧进行特征提取处理,获得多个特征通道的时空特征图,包括: 通过多个3D卷积层级,对连续的第一预设数量个待处理视频帧进行逐层特征提取处理,获得每个3D卷积层级输出的第一3D特征图; 将每个3D卷积层级输出的第一3D特征图进行逐层级特征融合,获得多个特征通道的时空特征图; 将每个3D卷积层级输出的第一3D特征图进行逐层级特征融合,获得多个特征通道的时空特征图,包括: 将每个层级的第一3D特征图通过卷积核尺寸为1×1×1的3D卷积核进行处理,获得每个层级的第二预设数量个第二3D特征图; 根据每个层级的第二3D特征图的尺寸和层级数量,对每个层级的第二预设数量个第二3D特征图进行递推处理,获得多个特征通道的时空特征图,其中,时空特征图的特征通道的数量为第二预设数量; 根据每个层级的第二3D特征图的尺寸和层级数量,对每个层级的第二预设数量个第二3D特征图进行递推处理,获得多个特征通道的时空特征图,包括: 在l=L时,将第L个层级的第二3D特征图设置为第L个层级的第三3D特征图,其中,L为3D卷积层级的数量; 将第L个层级的第三3D特征图进行上采样,获得与第L-1个层级的第二3D特征图尺寸相同的第四3D特征图; 将特征通道相同的第L个层级的第四3D特征图和第L-1个层级的第二3D特征图进行融合,获得第L-1个层级的第三3D特征图; 在l≠L时,将第l个层级的第三3D特征图进行上采样,获得与第l-1个层级的第二3D特征图尺寸相同的第四3D特征图; 将特征通道相同的第l个层级的第四3D特征图和第l-1个层级的第二3D特征图进行融合,获得第l-1个层级的第三3D特征图; 在所述第三3D特征图的尺寸达到预设尺寸时,停止递推,并将多个特征通道的第三3D特征图确定为多个特征通道的时空特征图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京鹍智科技有限责任公司,其通讯地址为:100176 北京市大兴区北京经济技术开发区(大兴)瀛海镇南海家园五里4号楼1层128室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励