崂山国家实验室王浩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉崂山国家实验室申请的专利声纳图像视觉问答方法及其系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121415084B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511959074.2,技术领域涉及:G06V10/40;该发明授权声纳图像视觉问答方法及其系统是由王浩;任翀;唐学大;高爽;耿文豹;黄贤青设计研发完成,并于2025-12-24向国家知识产权局提交的专利申请。
本声纳图像视觉问答方法及其系统在说明书摘要公布了:本发明属于图像视觉问答技术领域,涉及一种声纳图像视觉问答方法及其系统。该方法包括,构建并训练声纳图像视觉问答模型,将待识别的声纳图像和问题输入到模型中获得答案;模型包括,对声纳图像进行处理以获得视觉嵌入的线性投影模块、对问题进行处理以获得文本嵌入的词嵌入模块、对视觉嵌入和文本嵌入拼接后的共嵌入进行处理以产生跨模态特征的VisionTransformer编码器模块、对视觉嵌入进行处理以产生增强视觉特征的对比增强模块、对跨模态特征和增强视觉特征进行处理以生成融合特征的特征互导融合模块、根据融合特征进行答案预测的分类器。本发明能够深入挖掘和充分识别声纳图像特有的信息,为声纳图像的视觉问答任务提供开创性的思路和方法。
本发明授权声纳图像视觉问答方法及其系统在权利要求书中公布了:1.声纳图像视觉问答方法,其特征在于,包括以下步骤: S1、构建声纳图像视觉问答模型;所述声纳图像视觉问答模型包括线性投影模块、词嵌入模块、VisionTransformer编码器模块、对比增强模块、特征互导融合模块、分类器;所述线性投影模块用于对声纳图像进行处理以获得视觉嵌入;所述词嵌入模块用于对问题进行处理以获得文本嵌入;所述VisionTransformer编码器模块用于对视觉嵌入和文本嵌入拼接后的共嵌入进行处理,以产生跨模态特征;所述对比增强模块用于对视觉嵌入进行处理,以产生增强的视觉特征;所述对比增强模块包括第二VisionTransformer编码器和深度卷积块,所述增强的视觉特征的产生包括,利用所述第二VisionTransformer编码器对视觉嵌入进行层归一化、多头自注意力层MSA层及MLP处理以输出,利用所述深度卷积块对进行多次卷积处理以获得增强的视觉特征;所述特征互导融合模块用于对跨模态特征和增强的视觉特征进行自注意力机制和引导注意力机制处理及交互动态融合,以生成融合特征;所述融合特征的生成包括,使用自注意力机制对跨模态特征和增强的视觉特征进行处理以获得自注意力输出和,使用引导注意力机制实现和之间的互相引导以获得互导特征和,根据式17对和进行交互处理以获得特征和,其中,表示逐元素相乘,和分别表示两个互导特征之间的交互结果,并通过动态权重矩阵和对特征进行动态融合,进而将、、和相结合获得融合特征;所述分类器用于根据融合特征进行答案预测; 17; S2、训练所述声纳图像视觉问答模型; S3、将待识别的声纳图像和问题输入到训练后的所述声纳图像视觉问答模型中,获得答案。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人崂山国家实验室,其通讯地址为:266237 山东省青岛市即墨区问海中路168号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励