首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种搭载于无人机的多模态场景内容理解系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:扬州万方科技股份有限公司

摘要:一种搭载于无人机的多模态场景内容理解系统,涉及深度学习和多模态内容理解领域。包括依次连接的信号采集单元、数据采样和处理单元、时空特征提取单元、双模态特征融合单元和场景内容分类单元,所述信号采集单元用于对音频数据和视频数据进行采集;所述数据采样和处理单元用于对音频数据进行处理形成频谱图以及对视频数据进行帧采样;所述时空特征提取单元用于对音频模态的连续频谱图提取特征以及对视频模态的连续帧提取时空特征;整个系统结合音频和视频完成场景内容的理解,相比于单模态或者单帧加逻辑的系统设计,本发明能够在单模态信息不足时依然能输出鲁棒的结论,并且凭借其帧间变化和动作特征提取能力可以理解更多动态场景内容类型。

主权项:1.一种搭载于无人机的多模态场景内容理解系统,其特征在于,包括依次连接的信号采集单元、数据采样和处理单元、时空特征提取单元、双模态特征融合单元和场景内容分类单元,所述信号采集单元用于对音频数据和视频数据进行采集;所述数据采样和处理单元用于对音频数据进行处理形成频谱图以及对视频数据进行帧采样;所述时空特征提取单元用于对音频模态的连续频谱图提取特征以及对视频模态的连续帧提取时空特征;所述双模态特征融合单元用于对时空特征提取单元提取的特征进行融合;所述场景内容分类单元用于对双模态特征融合单元的输出特征向量进行内容分类,得出特征向量对应的类别编号,映射为原音视频所归属的内容类别。

全文数据:

权利要求:

百度查询: 扬州万方科技股份有限公司 一种搭载于无人机的多模态场景内容理解系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。