Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西北工业大学高剑获国家专利权

西北工业大学高剑获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西北工业大学申请的专利一种基于新颖性度量的SAC强化学习视觉伺服控制方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116382089B

龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310439089.0,技术领域涉及:G05B13/04;该发明授权一种基于新颖性度量的SAC强化学习视觉伺服控制方法及系统是由高剑;何耀祯;陈依民;李宇丰设计研发完成,并于2023-04-21向国家知识产权局提交的专利申请。

一种基于新颖性度量的SAC强化学习视觉伺服控制方法及系统在说明书摘要公布了:本发明涉及一种新颖性度量的SAC强化学习视觉伺服控制及系统,涉及强化学习在视觉伺服方面的应用领域。该方法包括了虚拟环境的构建,目标函数定义、交互过程中奖励函数的定义、新颖性度量函数定义等步骤。执行阶段通过将目标位置信息输入至强化学习的策略网络中,根据策略网络输出的控制速度信息对四旋翼进行位置控制。本发明解决了相关理论中从视觉特征到控制速度信息之间环节较多的问题,实现了从特征到控制量的端对端控制,从而减少了人为设计环节。

本发明授权一种基于新颖性度量的SAC强化学习视觉伺服控制方法及系统在权利要求书中公布了:1.一种基于新颖性度量的SAC强化学习视觉伺服控制方法,其特征在于,包括:创建四旋翼跟踪目标的虚拟环境:构建用于SAC强化学习中描述训练的Actor-Critic网络结构,所述的Actor-Critic网络结构包括策略网络Actor与值网络Critic:两个网络分别学习视觉伺服策略和拟合强化学习中的值函数;定义训练网络过程中的目标函数与外在奖励函数,所述的目标函数采用强化学习SoftActor-Critic方法一致的函数,所述的外在奖励函数通过目标在视野中的位置进行定义;训练过程中,设计一种聚类的方式衡量访问状态的新颖程度的方法,通过提出的中心化聚类度量访问状态的新颖性,作为内在奖励;通过强化学习智能体在虚拟环境中进行不断交互得到训练数据,包含目标位置、外在奖励与内在奖励、控制量、下一时刻目标位置,采用SAC强化学习对网络进行优化;实际使用时,先获取目标检测结果的位置信息,再将该信息输入至Actor网络得到控制量,将控制量传给四旋翼从而进行伺服控制。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。