恭喜北京邮电大学孙利娟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京邮电大学申请的专利视频分类的方法、装置、电子设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114037946B 。
龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111556380.3,技术领域涉及:G06V20/40;该发明授权视频分类的方法、装置、电子设备及介质是由孙利娟;吴京宸;吴旭;颉夏青;李飞;张熙;杨金翠;邱莉榕;张勇东;方滨兴设计研发完成,并于2021-12-17向国家知识产权局提交的专利申请。
本视频分类的方法、装置、电子设备及介质在说明书摘要公布了:本申请公开了一种视频分类的方法、装置、电子设备及介质。本申请中,可以获取待分类视频数据;将待分类视频数据输入至音视频学习网络,得到待分类视频对应的图像特征和音频特征;以及待分类视频对应的文本特征;将图像特征、音频特征以及文本特征输入至融合学习网络,得到融合特征向量;将融合特征向量输入至Softmax分类器,并将分类器输出的分类结果作为待分类视频的分类结果。通过应用本申请的技术方案,可以在获取待分类视频之后,利用预设的学习网络模型,得到该视频数据的图像特征、音频特征以及文本特征,并将该三个特征进行融合后,根据融合的特征来判断待分类视频的分类结果。从而避免了相关技术中对视频数据分类不准确的弊端。
本发明授权视频分类的方法、装置、电子设备及介质在权利要求书中公布了:1.一种视频分类的方法,其特征在于,包括:获取待分类视频数据;将所述待分类视频数据输入至音视频学习网络,得到所述待分类视频对应的图像特征和音频特征;以及,将所述待分类视频数据输入至文本学习网络,得到所述待分类视频对应的文本特征;将所述图像特征、所述音频特征以及所述文本特征输入至融合学习网络,得到融合特征向量;将所述融合特征向量输入至Softmax分类器,并将所述分类器输出的分类结果作为所述待分类视频的分类结果;其中,所述将所述待分类视频数据输入至文本学习网络,得到所述待分类视频对应的文本特征,包括:对所述待分类视频数据进行语音识别,得到待处理文本;利用预设转换规则,将所述待处理文本中包含的字母字段以及表情字段转换为文本字段;将包含所述文本字段的待处理文本转换为one-hot向量;将所述one-hot向量输入至所述文本学习网络进行深度语义特征提取,得到所述文本特征;其中,建立表情和含义映射表,将所述待处理文本中包含的所述表情字段替换为标准文本;将字母及缩写替换为输入法相应结果中的第一个候选词;所述将所述图像特征、所述音频特征以及所述文本特征输入至融合学习网络,得到融合特征向量,包括:分别对所述图像特征、所述音频特征以及所述文本特征进行向量转换,得到图像特征向量、音频特征向量以及文本特征向量;对所述图像特征向量、音频特征向量以及文本特征向量进行向量相加,得到第一融合特征向量;以及,对所述图像特征向量、音频特征向量以及文本特征向量进行乘积归一化,得到第二融合特征向量;基于所述第一融合特征向量以及所述第二融合特征向量,得到所述融合特征向量;其中,得到所述第二融合特征向量的方式为对所述图像特征向量、所述音频特征向量以及所述文本特征向量求Hadamard乘积。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。