基于强化学习的载人登月轨道设计方法、装置和设备

导航：龙图腾网> 最新专利技术> 基于强化学习的载人登月轨道设计方法、装置和设备

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国人民解放军国防科技大学

摘要：本申请涉及基于强化学习的载人登月轨道设计方法、装置和设备，方法包括：获取建立的全任务轨道优化模型的任务约束条件；获取智能体的决策动作空间；根据任务约束条件和决策动作空间，设置马尔科夫决策模型及强化学习中Q学习算法的参数；根据载人登月全任务的总收益，设置Q学习算法的奖励函数中速度增量阈值；Q学习算法的奖励函数为原始奖励函数与启发式奖励函数之和；启动马尔科夫决策模型及Q学习算法的优化计算，直至得到智能体的最优飞行方案；最优飞行方案包括智能体出发和到达的目标轨道；根据最优飞行方案，利用真实轨道动力学模型进行外推计算，得到智能体的全任务轨道方案。实现了载人登月全任务多阶段轨道优化与设计。

主权项：1.一种基于强化学习的载人登月轨道设计方法，其特征在于，包括步骤：获取建立的全任务轨道优化模型的任务约束条件；所述全任务轨道优化模型以载人登月全任务的总速度增量最小总收益为目标；获取智能体的决策动作空间；所述智能体包括载人飞船和月面着陆器；根据所述任务约束条件和所述决策动作空间，设置马尔科夫决策模型及强化学习中Q学习算法的参数；所述马尔科夫决策模型用于描述所述全任务轨道优化模型的决策过程；根据所述载人登月全任务的总收益，设置所述Q学习算法的奖励函数中速度增量阈值；所述Q学习算法的奖励函数为原始奖励函数与启发式奖励函数之和，所述启发式奖励函数用于加快优化计算过程中Q函数的收敛性；启动所述马尔科夫决策模型及所述Q学习算法的优化计算，直至得到智能体的最优飞行方案；所述最优飞行方案包括所述智能体出发和到达的目标轨道；根据所述最优飞行方案，利用真实轨道动力学模型进行外推计算，得到所述智能体的全任务轨道方案。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学基于强化学习的载人登月轨道设计方法、装置和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于修复叶片根部的方法

下一篇：一种塑管熔接装置

相关技术

用于修复叶片根部的方法

一种塑管熔接装置

一种变电站光伏系统发电量与站用电负荷匹配的控制系统及控制方法

水泵减振装置

一种煤矿井下风水管路在线监测系统

基于大语言模型的代码处理方法、装置、设备和介质

一种电动汽车无线充电系统漏磁优化方法

热回收系统的控制方法、控制装置及计算机可读存储介质

一种汽车减震器的衬套装配装置

一种AGV随行系统、方法、装置、设备及存储介质

一种平开窗

一种可热封餐盒及其制备方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于强化学习的载人登月轨道设计方法、装置和设备

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务