中山大学贺之纤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中山大学申请的专利一种高斯引导跨模态学习的视频问答定位方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120144693B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510008837.9,技术领域涉及:G06F16/3329;该发明授权一种高斯引导跨模态学习的视频问答定位方法与系统是由贺之纤;林淑金;陈小燕设计研发完成,并于2025-01-03向国家知识产权局提交的专利申请。
本一种高斯引导跨模态学习的视频问答定位方法与系统在说明书摘要公布了:本发明公开了一种高斯引导跨模态学习的视频问答定位方法与系统。包括:对视频问答公开数据集进行特征提取,得到视频帧特征和问题特征;将视频帧特征输入时间Transformer,得到全局时序特征和注意力权重;利用全局时序特征和问题特征,构建时间权重分布,对视频帧特征加权,得到加权视觉特征;利用注意力权重和时间权重分布构建时间回溯机制,得到时间回溯特征;将时间回溯特征和问题特征进行特征融合,得到多模态融合特征和预测答案;引入跨时间因果对比损失进行学习,得到训练完成的模型;用户将待处理视频和问题输入训练完成的模型,输出问题的预测答案和视频定位结果。本发明能够提升定位的语义相关性、降低模型运算复杂度、提升模型的定位表现。
本发明授权一种高斯引导跨模态学习的视频问答定位方法与系统在权利要求书中公布了:1.一种高斯引导跨模态学习的视频问答定位方法,其特征在于,所述方法包括: 对视频问答公开数据集中的视频数据、问题文本数据和答案文本数据进行特征提取,得到视频帧特征fv和问题特征fq;所述视频帧特征fv由若干个时间帧特征组成,时间帧特征中包括查询向量Qt、键向量Kt、值向量Vt; 将所述视频帧特征fv输入时间Transformer,得到全局时序特征和注意力权重Aij;所述注意力权重Aij表示帧i对帧j的局部依赖程度; 利用所述全局时序特征和所述问题特征fq,得到动态高斯分布的中心点μ和范围σ,计算公式分别为: 其中,和分别是所述全局时序特征的权重矩阵,和分别是问题特征fq的权重矩阵,和在模型初始化阶段会被随机初始化,并在梯度下降过程中更新,所述问题特征fq是修正项,wμ和wσ控制修正强度; 利用动态高斯分布的中心点μ和范围σ构建时间权重分布pt,具体计算公式为: 其中T为采样总帧数; 构建归一化的时间权重分布Pt,对所述视频帧特征fv加权,得到加权视觉特征 利用所述注意力权重Aij和所述时间权重分布Pt构建时间回溯机制,得到时间回溯特征将所述注意力权重Aij和所述值向量Vt进行点积,生成因果特征利用所述时间权重分布Pt对所述因果特征进行加权,得到时间回溯特征 将所述时间回溯特征和所述问题特征fq进行特征融合,得到多模态融合特征fcls和预测答案 输入所述视频帧特征fv、所述时间权重分布Pt和所述时间回溯特征引入跨时间因果对比损失进行学习,得到训练完成的模型,其中包括构建对比学习的正负样本:利用所述时间权重分布Pt对所述视频帧特征fv中的所述时间帧特征进行点积加权,得到正样本并从所述时间权重分布Pt较低的帧中随机选取负样本 用户将待处理视频和问题输入所述训练完成的模型,输出问题的预测答案和与答案相应的视频定位结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中山大学,其通讯地址为:510006 广东省广州市海珠区新港西路135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励