Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 鹏城实验室许浩然获国家专利权

鹏城实验室许浩然获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉鹏城实验室申请的专利基于视觉强化学习的模型训练方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120543954B

龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511038413.3,技术领域涉及:G06V10/764;该发明授权基于视觉强化学习的模型训练方法、装置、设备及介质是由许浩然;李论通;彭佩玺;夏灿铭;常亦谦;孙博;谭光;黎文博;许芬;田永鸿设计研发完成,并于2025-07-28向国家知识产权局提交的专利申请。

基于视觉强化学习的模型训练方法、装置、设备及介质在说明书摘要公布了:本申请实施例提供了一种基于视觉强化学习的模型训练方法、装置、设备及介质。包括:获取样本图像帧及语义类别信息,将语义类别信息输入视觉大语言模型,得到第一卷积核参数,及将样本图像帧输入第一特征卷积核得到第一特征热力图;通过预设视觉强化学习模型得到样本图像帧的第二卷积核参数和第二特征热力图;基于第一卷积核参数与第二卷积核参数构建第一蒸馏损失,及基于第一特征热力图与第二特征热力图构建第二蒸馏损失;通过样本动作数据和样本状态数据预测和计算,构建自监督损失和目标策略损失;基于第一蒸馏损失、第二蒸馏损失、自监督损失和目标策略损失,对预设视觉强化学习模型进行参数调节,得到目标视觉强化学习模型。

本发明授权基于视觉强化学习的模型训练方法、装置、设备及介质在权利要求书中公布了:1.一种基于视觉强化学习的模型训练方法,其特征在于,所述方法包括: 获取样本图像帧以及对应的语义类别信息,并将所述语义类别信息输入至视觉大语言模型的初始第一卷积核中进行文本特征提取,得到提取文本特征后的第一特征卷积核的第一卷积核参数,以及将所述样本图像帧输入至所述第一特征卷积核中,得到第一特征热力图; 通过预设视觉强化学习模型的视觉编码器包含的初始第二特征卷积核对所述样本图像帧进行处理,得到处理图像后的第二特征卷积核的第二卷积核参数和第二特征热力图; 基于所述第一卷积核参数与所述第二卷积核参数之间的差异构建第一蒸馏损失,以及基于所述第一特征热力图与所述第二特征热力图之间的差异构建第二蒸馏损失; 通过预设自监督模型对所述第二特征热力图对应的样本动作数据和样本状态数据进行下一时刻的状态和奖励预测,得到每个样本图像帧的预测结果,并根据多个样本图像帧对应的多个预测结果构建自监督损失; 通过所述预设视觉强化学习模型的策略解码器,基于所述样本动作数据和所述样本状态数据进行动作价值和动作采样计算,得到每个样本图像帧的计算结果,并根据多个样本图像帧对应的多个计算结果构建目标策略损失; 基于所述第一蒸馏损失、所述第二蒸馏损失、所述自监督损失和所述目标策略损失,对所述预设视觉强化学习模型的参数进行调节,得到目标视觉强化学习模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人鹏城实验室,其通讯地址为:518000 广东省深圳市南山区兴科一街2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。