成都大熊猫繁育研究基地陈鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都大熊猫繁育研究基地申请的专利基于注意力机制的视觉-文本跨模态大熊猫行为识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120997886B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511541994.2,技术领域涉及:G06V40/10;该发明授权基于注意力机制的视觉-文本跨模态大熊猫行为识别方法是由陈鹏;郑维超;金子成;张萍;侯蓉;何梦楠;马莹;罗概;吴鹏程;巫林;杨淑曼设计研发完成,并于2025-10-27向国家知识产权局提交的专利申请。
本基于注意力机制的视觉-文本跨模态大熊猫行为识别方法在说明书摘要公布了:本发明提供了基于注意力机制的视觉‑文本跨模态大熊猫行为识别方法,涉及注意力机制技术领域,先将多模态数据集输入初始模型,提取大熊猫行为特征,引入定制化跨模态注意力机制实现特征对齐,强化视觉与文本特征交互深度,突破语义融合不足的瓶颈;再基于特征构建视频帧序列‑文本描述成对样本,通过跨模态表征网络在统一嵌入空间开展双向匹配学习,以对称交叉熵损失优化参数,结合验证与早停机制固化模型,捕捉视频时序信息,解决行为动态表征不完整问题;最后对目标大熊猫行为数据的视觉部分优化处理,依据质量参数调节预处理策略,使优化结果辅助注意力机制聚焦关键特征,改善预处理无统一标准且无法反馈的现状,最终精准识别目标行为类别。
本发明授权基于注意力机制的视觉-文本跨模态大熊猫行为识别方法在权利要求书中公布了:1.基于注意力机制的视觉-文本跨模态大熊猫行为识别方法,其特征在于,所述方法包括: 步骤一、将多模态数据集输入初始行为识别模型,通过Transformer网络提取大熊猫行为的特征数据,并引入跨模态注意力机制对特征数据进行对齐处理; 步骤二、基于大熊猫行为的特征数据,构建视频帧序列—文本描述的成对样本,由跨模态表征网络在统一嵌入空间内开展双向匹配学习,并由优化器以对称交叉熵损失作为主损失函数实施参数更新,要求配对样本相互靠拢、非配对样本相互分离,通过验证与早停机制约束,当监测到训练结束标志时,固化得到的行为识别模型参数与推理流程,从而将初始行为识别模型标记为行为识别模型; 步骤三、获取目标大熊猫行为数据,并对目标大熊猫行为数据中的视觉数据进行数据优化处理,将优化处理完成的目标大熊猫行为数据输入至行为识别模型,通过行为识别模型分析识别出目标大熊猫行为类别; 所述对目标大熊猫行为数据中的视觉数据进行数据优化处理,具体指: 获取视觉数据的感知哈希熵值、视觉数据的局部对比度熵以及视觉数据的帧间光流梯度模长方差; 将感知哈希熵值与感知哈希熵值允许最小值进行比对,将局部对比度熵与局部对比度熵允许最小值进行比对,将帧间光流梯度模长方差运行最大值与帧间光流梯度模长方差进行比对,各比对结果进行加权汇总,从而得出视觉数据的质量表征系数,所述视觉数据的质量表征系数,用于对视觉数据的清晰质量进行量化表征; 将视觉数据的质量表征系数与界定质量表征系数进行比对; 若视觉数据的质量表征系数大于或等于界定质量表征系数,则执行当前数据清洗流程,从而进行数据优化处理,将优化处理完成的目标大熊猫行为数据输入至行为识别模型; 若视觉数据的质量表征系数小于界定质量表征系数,则对当前数据清理流程进行调节。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都大熊猫繁育研究基地,其通讯地址为:610000 四川省成都市成华区熊猫大道1375号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励