东南大学张宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种基于时间感知特征学习的动作质量评估方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113920584B 。
龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111207579.5,技术领域涉及:G06V40/20;该发明授权一种基于时间感知特征学习的动作质量评估方法是由张宇;米思娅;熊伟设计研发完成,并于2021-10-15向国家知识产权局提交的专利申请。
本一种基于时间感知特征学习的动作质量评估方法在说明书摘要公布了:本发明公开了一种基于时间感知特征学习的动作质量评估方法。该方法采用3D卷积网络学习了视频中的片段特征,并将片段特征通过时间感知模块去学习片段之间的关系,此关系能够抓住动作的变换信息来提高动作质量评估的准确性。然后通过片段关系去聚合得到整个视频的特征,其中视频特征可以直接用于动作的分数预测。此外,引入了字幕生成以及动作识别两个辅助任务来使得3D卷积网络能够学习到更丰富的特征表示。最后,为了确保时间感知模块能够更准确地抓住动作的变换信息,引入了一个对抗损失来稳定整个模型。本发明能够在动作质量评估数据集上提取到具有判别性的特征表示,有效的提高动作质量分评估问题中的斯皮尔曼相关系数。
本发明授权一种基于时间感知特征学习的动作质量评估方法在权利要求书中公布了:1.一种基于时间感知特征学习的动作质量评估方法,其特征在于,包括以下七个步骤: 步骤一:将输入的视频分为个片段,并对每个帧进行下采样以及数据增强; 步骤二:利用I3D网络去提取每个片段的特征,并将片段级特征输入字幕生成模块计算字幕生成损失; 步骤三:将片段级特征分别输入时间感知模块和平均聚合模块得到视频级特征和; 步骤四:将视频级特征和分别输入分数预测模块计算分数预测损失以及对抗损失; 步骤五:将视频级特征输入动作识别模块计算动作识别损失; 步骤六:最小化损失并更新模型参数; 步骤七:利用分数预测模块对视频级特征进行计算之后的分数即为对视频的预测分数; 步骤一中,所述下采样为对图片进行中心裁剪,数据增强为对图片进行随机水平旋转; 步骤二中,字幕生成模块所用网络为门控循环网络GRU,即将视频特征作为初始输入得到初始输出向量以及初始状态向量,再循环字幕生成的最大长度的次数,更新其输出向量以及状态向量,且每次循环输出一个单词,最后组成了整个字幕输出;而字幕生成损失为生成字幕以及实际字幕的负对数似然损失函数; 步骤三中,所述时间感知模块由两个全连接层、ReLU激活函数、Softmax归一化指数函数组成;其中,第一个全连接层对特征进行压缩,ReLU激活函数增加了特征的非线性,第二个全连接层将特征维度压缩为1,而Softmax对特征进行归一化处理得到权重;最后再将权重与片段特征进行点乘以及求和得到具有判别性的视频特征;所述平均聚合模块直接将输入的片段特征进行平均求和得到视频特征; 步骤四中,所述对抗损失为由预测出的分数与真值的差值和由预测出的分数与真值的差值组成的折页损失; 所述分数预测模块为两个全连接层组成的网络结构;其中,第一个全连接层对特征进行降维处理,第二个全连接层将特征维度压缩为1来预测分数; 步骤五中,动作识别模块为全连接层组成的分类模型,对于每一个子动作都有一个全连接层进行分类,其中,位置分为3类、扭转分为8类、旋转类型分为4类、旋转次数分为10类、臂力分为2类,动作识别损失为交叉熵损失; 步骤六中,采用的最小化损失方法为Adam算法,其中,损失包括字幕生成损失、动作识别损失、分数预测损失和对抗损失。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210000 江苏省南京市麒麟科创园智识路26号启迪城立业园04幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励