华中科技大学张海涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华中科技大学申请的专利无人艇避障模块训练方法及训练装置、未知区域探索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116341647B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310117721.X,技术领域涉及:G06N3/092;该发明授权无人艇避障模块训练方法及训练装置、未知区域探索方法是由张海涛;邹家喻;孙思卿;丁佳宁;梁诗亚设计研发完成,并于2023-02-15向国家知识产权局提交的专利申请。
本无人艇避障模块训练方法及训练装置、未知区域探索方法在说明书摘要公布了:本发明公开了一种无人艇避障模块训练方法及训练装置、未知区域探索方法。其中,无人艇避障模块具有TD3智能体,训练方法包括:获取智能体在当前观测状态si下执行当前动作ai后环境反馈的下一时刻的观测状态si'和奖励ri,以si,ai,ri,si'作为当前样本存入经验缓存,其中,奖励ri包含反应无人艇当前位置距离目标位置的距离奖励以及与障碍物之间安全程度的安全性奖励;计算每个样本的样本权重,样本权重是与critic网络的残差平方和actor网络的损失绝对值之和成正比;根据样本权重抽取若干样本对智能体进行训练以更新智能体各网络参数,其中,样本权重越大、被抽取的概率越大。通过计算权重并根据权重进行抽样,便能够获取避障精度较高的无人艇避障模块。
本发明授权无人艇避障模块训练方法及训练装置、未知区域探索方法在权利要求书中公布了:1.一种无人艇避障模块训练方法,其特征在于,所述无人艇避障模块具有TD3算法的智能体,所述训练方法包括: 步骤S1:初始化智能体各网络、环境的观测状态和智能体的初始动作; 步骤S2:获取智能体在当前观测状态下执行当前动作后环境反馈的下一时刻的观测状态和奖励,以作为当前样本存入经验缓存,其中,奖励包含反应无人艇当前位置距离目标位置的距离奖励以及与障碍物之间安全程度的安全性奖励; 步骤S3:当所述经验缓存中存入预设数量的样本后,计算每个样本的样本权重,所述样本权重是与critic网络的残差平方和actor网络的损失绝对值之和成正比; 步骤S4:根据样本权重抽取若干样本对智能体进行训练以更新智能体各网络参数,其中,样本权重越大、被抽取的概率越大; 每个样本的样本权重的计算公式为: 其中,表示归一化前的概率,表示任一critic网络的残差,表示在智能体两个critic网络的残差平方中取较大值,表示actor网络的损失,其中,表示为在当前观测状态下actor网络执行当前动作后任一critic网络输出的Q值,为critic网络当前的网络参数,表示梯度算子,表示在智能体actor网络的两个损失绝对值中取较大者,为用于平衡为残差和损失之间数量级的权重经验参数,和分别为根据实验确定的补充概率和平衡因子,为小于0.3的正数,为小于1的正数,k表示当前经验缓存中样本的个数,表示进行归一化后的样本权重。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励