首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于AI的视频、音乐卡点匹配方法及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:深圳市九分文化传媒有限公司

摘要:本发明涉及人工智能技术,揭露了一种基于AI的视频、音乐卡点匹配方法及介质,包括:识别目标音频的频谱并提取频谱的频谱特征,利用预先训练的鼓点识别模型根据频谱特征对目标音频进行鼓点识别,得到鼓点时间戳列表,根据目标视频建立运动轨迹模型,对运动轨迹模型的每一个动作帧进行特征提取,计算相邻的动作特征差异值,提取差异值大于或等于差异值阈值的相邻的动作特征中的后一个动作特征,根据提取出的动作特征匹配得到目标视频的关键帧时间戳列表,根据鼓点时间戳列表以及关键帧时间戳列表对目标视频以及目标音频进行卡点匹配,得到卡点视频。本发明还提出一种基于AI的视频、音乐卡点匹配存储介质。本发明可以提高音视频的卡点匹配效率。

主权项:1.一种基于AI的视频、音乐卡点匹配方法,其特征在于,所述方法包括:获取需要进行卡点匹配的目标视频以及目标音频;识别所述目标音频的频谱,提取所述频谱的频谱特征;利用预先训练的鼓点识别模型根据所述频谱特征对所述目标音频进行鼓点识别,得到鼓点时间戳列表;根据所述目标视频建立运动轨迹模型;对所述运动轨迹模型的每一个动作帧进行特征提取,得到动作特征集合;计算所述动作特征集合中相邻的动作特征之间的差异值,其中,利用如下公式计算所述差异值: 其中,C为所述动作特征集合的协方差矩阵,N为所述动作特征集合的动作特征数量,Fk表示所述动作特征集合中第k个动作特征,D为所述差异值,ΔFi表示所述相邻的动作特征的特征向量在第i个维度上的差值,ΔFj示所述相邻的动作特征的特征向量在第j个维度上的差值,n为向量的维度,Cii表示所述动作特征集合的协方差矩阵C第i行第i列的元素,Cij表示所述动作特征集合的协方差矩阵C第i行第j列的元素;提取所有差异值大于或等于预设的差异值阈值的相邻的动作特征中的后一个动作特征,得到关键动作特征集合;根据所述关键动作特征集合对所述目标视频进行关键帧匹配,得到关键帧时间戳列表;根据所述鼓点时间戳列表以及所述关键帧时间戳列表对所述目标视频以及目标音频进行卡点匹配,得到卡点视频。

全文数据:

权利要求:

百度查询: 深圳市九分文化传媒有限公司 基于AI的视频、音乐卡点匹配方法及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术