杭州电子科技大学丽水研究院颜成钢获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学丽水研究院申请的专利一种基于多维度信息交互的视频特征提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117274855B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311058507.8,技术领域涉及:G06V20/40;该发明授权一种基于多维度信息交互的视频特征提取方法是由颜成钢;金裕达;郭雨晨;赵思成;孙垚棋;朱尊杰;高宇涵;王鸿奎;赵治栋;殷海兵;王帅;张继勇;李宗鹏;丁贵广;付莹;李晓林;沙雏淋设计研发完成,并于2023-08-22向国家知识产权局提交的专利申请。
本一种基于多维度信息交互的视频特征提取方法在说明书摘要公布了:本发明公开了一种基于多维度信息交互的视频特征提取方法,首先进行数据集获取,采用现有的视频分类数据集;构建基于多维度信息交互的视频特征提取网络,包括前缀卷积网络、时空可分离编码器和视频分类器;之后构建损失函数,最后根据获取的数据集对构建的基于多维度信息交互的视频特征提取网络进行训练。本发明将时序信息交互与空间信息交互相结合,弥补了两者不能共存的短板。使用前缀卷积网络以及时间空间可分离注意力机制,减少了大量的算力开销。
本发明授权一种基于多维度信息交互的视频特征提取方法在权利要求书中公布了:1.一种基于多维度信息交互的视频特征提取方法,其特征在于,包括步骤如下: 步骤1:数据集获取,采用现有的视频分类数据集; 步骤2:构建基于多维度信息交互的视频特征提取网络; 所述的基于多维度信息交互的视频特征提取网络包括前缀卷积网络、时空可分离编码器和视频分类器;前缀卷积网络为一个去除最后两层的Resnet50网络; 时空可分离编码器是一个TransformerEncoder,它由三个时空可分离编码器层堆叠而成; 时空可分离编码器层包含三个重要组成部分:空间自注意力模块、时序自注意力模块、前向传播模块FFN,这三个模块都被残差链接及层归一化模块LN包裹,即在这三个模块之后都连接有残差链接及层归一化模块LN; 残差链接及层归一化模块LN:假定输入的特征张量为X,则LN公式表示如下; 其中表示层归一化算法,表示LN所包裹的函数; 空间自注意力模块SSA首先将特征张量经过三个独立的卷积核,获得对应的查询向量 Q、键向量K和值向量V,其过程能够用以下公式表示; 随后将,使得维度变成,组成了空间维度; 随后在分辨率层面进行自注意力操作;其中T表示帧的数量,H表示每一帧画面的高度,W表 示每一帧画面的宽度,C表示每一帧画面的通道数; 时序自注意力模块TSA,与SSA相似,假设输入的特征张量为X,其过程能够用以下公式表示; 其中三个卷积层的结构是与空间自注意力编码器中的卷 积层是一样的,但是参数是独立的,这里使用相同的符号标记; 随后交换前三个维度的顺序,使得他们的维度变成,组成 了时间维度;在空间维度进行自注意力操作; 前向传播模块FFN,是一个MLP层,输入和输出维度都是C; 上一个时空可分离编码器层的输出作为下一个时空可分离编码器层的输入,依次类推,最后一个时空可分离编码器层输出的特征用于下游的分类任务; 步骤3.构建损失函数; 构建视频分类损失; 其中Y是数据集所标注的正确的视频分类标签分类;CLS是多分类的概率分布; 步骤4.根据获取的数据集对构建的基于多维度信息交互的视频特征提取网络进行训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学丽水研究院,其通讯地址为:323010 浙江省丽水市莲都区南明山街道大沅街与绿源路交叉口东北侧半导体芯片产业园3号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励