恭喜西北工业大学王震获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜西北工业大学申请的专利一种短视频信息检测方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119540841B 。
龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510095985.9,技术领域涉及:G06V20/40;该发明授权一种短视频信息检测方法、装置、设备及存储介质是由王震;祁博涵;井卫凯;李晓宇;高超;李向华设计研发完成,并于2025-01-22向国家知识产权局提交的专利申请。
本一种短视频信息检测方法、装置、设备及存储介质在说明书摘要公布了:本发明公开了一种短视频信息检测方法、装置、设备及存储介质,涉及网络空间安全信息检测技术领域,包括以下步骤:获取目标短视频中的多模态信息,提取各模态信息对应的多个模态特征;将标题特征与其他模态特征分别进行特征对齐,得到与标题最相关的多个关键特征;分别对与标题最相关的多个关键特征之间的一致性进行建模,得到第一融合特征表示以及第二融合特征表示;将第一融合特征表示、第二融合特征表示和标题特征进行拼接,得到多模态融合特征;对多模态融合特征进行分类,得到目标短视频中多模态信息的检测结果。本方法基于特征对齐和语义一致性建模,更好地挖掘并融合了短视频中的关键信息,大幅提升了信息的检测结果的准确性。
本发明授权一种短视频信息检测方法、装置、设备及存储介质在权利要求书中公布了:1.一种短视频信息检测方法,其特征在于,包括以下步骤:获取目标短视频中的多模态信息,提取各模态信息对应的多个模态特征,多个所述模态特征包括标题特征、视频字幕特征、视频帧特征、视频时空特征和音频帧特征;将标题特征与其他模态特征分别进行特征对齐,得到与标题最相关的多个关键特征;多个所述关键特征包括视频帧关键特征、视频字幕关键特征、视频时空关键特征和音频帧关键特征;分别对视频帧关键特征和音频帧关键特征以及视频字幕关键特征和视频时空关键特征之间的一致性进行建模,得到视频帧和音频帧的第一融合特征表示以及视频字幕和视频时空信息的第二融合特征表示;将第一融合特征表示、第二融合特征表示和标题特征进行拼接,得到多模态融合特征;对多模态融合特征进行分类,得到目标短视频中多模态信息的检测结果;所述多模态信息包括文本信息、视频帧序列和音频帧序列,所述文本信息包括标题和视频字幕;所述提取各模态信息对应的多个模态特征,包括以下步骤:将标题和视频字幕输入至BERT预训练模型,提取标题特征RT和视频字幕特征RC;将视频帧序列输入至VGG19模型,提取视频帧特征RF;将音频帧序列输入至VGGish模型,提取音频帧特征RA;将视频帧序列作为视频剪辑输入至C3D模型,提取视频时空特征RV;所述分别对视频帧关键特征和音频帧关键特征以及视频字幕关键特征和视频时空关键特征之间的一致性进行建模,得到视频帧和音频帧的第一融合特征表示以及视频字幕和视频时空信息的第二融合特征表示,具体包括以下步骤:通过两个独立的Bi-GRU模型对音频帧关键特征和视频帧关键特征之间的语义一致性进行建模,并利用上下文相关的全局表示来初始化Bi-GRU,获得第一融合特征,具体如下所示: RAF|T=Bi-GRURA|T,HAF;RFA|T=Bi-GRURF|T,HAF; 式中,HAF为Bi-GRU模型输入的初始隐藏向量,RA|T为音频帧关键特征,RF|T为视频帧关键特征,RAF|T为增强后的音频帧特征表示,RFA|T为增强后的视频帧特征表示,RA,F|T为第一融合特征表示;通过两个独立的Bi-GRU模型对视频字幕关键特征和视频时空关键特征之间的语义一致性进行建模,并利用上下文相关的全局表示来初始化Bi-GRU,获得第二融合特征,具体如下所示: RCV|T=Bi-GRURC|T,HCV;RVC|T=Bi-GRURV|T,HCV; 式中,HCV为Bi-GRU模型输入的初始隐藏向量,RC|T为视频字幕关键特征,RV|T为视频时空关键特征,RCV|T为增强后的视频字幕特征表示,RVC|T为增强后的视频时空特征表示,RC,V|T为第二融合特征表示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710068 陕西省西安市碑林区友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。