安徽星邦数字科技集团有限公司蔡昌俊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽星邦数字科技集团有限公司申请的专利一种基于多模态分析的短视频智能剪辑方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120935432B 。
龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511456493.4,技术领域涉及:H04N21/8547;该发明授权一种基于多模态分析的短视频智能剪辑方法及系统是由蔡昌俊;丁梅;席宏飞设计研发完成,并于2025-10-13向国家知识产权局提交的专利申请。
本一种基于多模态分析的短视频智能剪辑方法及系统在说明书摘要公布了:本发明公开了一种基于多模态分析的短视频智能剪辑方法及系统,涉及视频剪辑技术领域。用于提升剪辑效率与视觉体验,对目标短视频流提取人物唇部运动特征、商品视觉显著性特征及语音情感强度值,形成多模态时序数据;随后,将语音流转录并提取产品关键词时间戳,同时结合视觉显著性峰值,通过动态时间规整计算对齐度,并结合情感强度值加权评估,生成初步剪辑点集合;构建基于深度强化学习的剪辑决策优化模型,将多模态特征作为状态输入,以联合奖励函数调整剪辑点保留概率并选择最优转场方式;分析剪辑点前后唇部运动与语音同步误差及过渡段情感与视觉连续性,对不连续区域进行平滑处理,输出剪辑成品,实现了精准化的短视频智能剪辑。
本发明授权一种基于多模态分析的短视频智能剪辑方法及系统在权利要求书中公布了:1.一种基于多模态分析的短视频智能剪辑方法,其特征在于,包括以下步骤: S1.对目标短视频流进行多模态特征提取,包括提取人物唇部运动特征、商品视觉显著性特征和语音情感强度值的时序数据; S2.对语音流进行转录并提取产品关键词时间戳,同时根据商品视觉显著性特征序列确定商品展示峰值时刻,通过动态时间规整算法计算商品视觉显著性峰值时刻与关键词时间戳之间的对齐度,当对齐度超过预设阈值时,结合该时刻的语音情感强度值进行加权评估,生成初步剪辑点集合; S3.构建基于深度强化学习的剪辑决策优化模型,将提取的多模态特征作为状态输入,将初步剪辑点集合作为候选动作空间,以商品识别准确率和语音-画面同步度作为联合奖励函数,在训练过程中,策略网络基于联合奖励函数反馈决定剪辑点的保留或舍弃,并为保留的剪辑点选择转场方式; S4.分析剪辑点前后唇部运动轨迹与语音流的同步误差,当误差超过预设偏差值时进行位置调整,评估剪辑过渡段的情感强度变化率和视觉注意力连续性,对检测到的不连续区域进行平滑处理,输出剪辑成品。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽星邦数字科技集团有限公司,其通讯地址为:230600 安徽省合肥市包河区徽州大道838号平安国际金融中心2001室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励