Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京大学包培钧获国家专利权

北京大学包培钧获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京大学申请的专利一种基于样本权重调整的跨场景视频语义定位方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115761560B

龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111026168.6,技术领域涉及:G06V20/40;该发明授权一种基于样本权重调整的跨场景视频语义定位方法和装置是由包培钧;穆亚东设计研发完成,并于2021-09-02向国家知识产权局提交的专利申请。

一种基于样本权重调整的跨场景视频语义定位方法和装置在说明书摘要公布了:本发明涉及一种基于样本权重调整的跨场景视频语义定位方法和装置。本发明同时使用两个具有相同主干网络结构的孪生模型,第一个模型仅读取视频输入而不读取句子,第二个模型同时读取完整的视频输入和句子;第一个模型用来学习偏好信息,仅根据视频单个模态就预测定位结果,并根据其学习得到的偏好信息去调整训练样本的权重,使得第二个模型收到的训练样本不具备数据偏好信息,迫使第二个模型同时理解视频和语言两个模态中共同的语义信息。本发明的提供了一种训练框架以防止模型过拟合于视频片段中的偏好信息,使之能够真正同时理解视频和句子两个模态并根据两者的语义信息在视频中做语义定位。本发明在跨场景条件下的泛化能力具有明显优势。

本发明授权一种基于样本权重调整的跨场景视频语义定位方法和装置在权利要求书中公布了:1.一种基于样本权重调整的跨场景视频语义定位方法,其特征在于,包括以下步骤: 利用视频编码器从输入视频提取视频候选窗口的视觉特征表示; 利用语言编码器对句子进行编码,获取句子的特征表示; 将视频候选窗口的视觉特征表示和句子的特征表示进行融合,得到视频候选窗口的视觉-语义特征表示; 利用视觉定位器,仅依据视频候选窗口的视觉特征表示预测定位结果,并从训练样本中学习视频片段的偏好信息,根据学习得到的偏好信息调整训练样本的权重; 利用视觉-语义定位器,依据视频候选窗口的视觉-语义特征表示预测定位结果,并利用调整权重后的训练样本对视觉-语义定位器进行训练,得到去偏好化处理的视觉-语义定位器; 对于待定位的视频和句子,利用训练完成的视觉-语义定位器进行视频语义定位。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学,其通讯地址为:100871 北京市海淀区颐和园路5号北京大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。