一种低轨星座中基于强化学习的星地测控链路规划方法

导航：龙图腾网> 最新专利技术> 一种低轨星座中基于强化学习的星地测控链路规划方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明提出了一种低轨星座中基于强化学习的星地测控链路规划方法，包括：考虑低轨巨型星座星地链路规划问题，满足星地可见约束、卫星链路数量约束、天线资源约束和变量可行域限制，建立最大化资源利用率和最小化切换次数的多目标优化模型；将星座整个运行周期的链路规划问题解耦成每个离散时间片内链路规划问题，采用深度强化学习中的深度Q网络算法求解多目标优化模型，完成最优的巨型星座星地链路规划决策，智能体根据每次分配时的可视卫星状态，选择最佳卫星建立链路完成星地测控链路规划。本发明利用强化学习实现智能体与环境的交互，优化星座测控过程中星地链路的切换次数，提高地面站天线资源的利用率，实现星地链路快速灵活高效的规划。

主权项：1.一种低轨星座中基于强化学习的星地测控链路规划方法，其特征在于，包括：考虑低轨巨型星座星地链路规划问题，同时满足星地可见约束、卫星链路数量约束、天线资源约束和变量可行域限制，建立最大化资源利用率和最小化切换次数的多目标优化模型；将星座整个运行周期的链路规划问题解耦成每个离散时间片内链路规划问题，采用深度强化学习中的深度Q网络算法求解多目标优化模型以完成最优的巨型星座星地链路规划决策，智能体根据每次分配时的可视卫星状态，做出最佳动作，选择最佳卫星建立链路从而完成星地测控链路规划；所述深度强化学习中的深度Q网络算法获取每个时间片内每个地面测控站的可视卫星序列状态信息，通过Q网络生成对应的动作Q值序列，经过动作的过滤与筛选，生成最终动作集合获取奖励并更新模型，实现方法为：步骤1：初始化DQN中评估网络和目标网络中每层神经元的权重和偏置参数；步骤2：智能体获取当前环境状态信息，包括时间片tk中地面测控站gi的可视卫星序列以及地面测控站gi在上一时间片tk-1与卫星的连接情况，根据状态空间中对卫星状态值的定义赋予可视卫星序列中的卫星sl一个状态值Fsl，并基于此构建可视卫星的状态序列作为网络输入特征；其中，LVmax为可视卫星序列中的最大长度步骤3：将可视卫星的状态序列State输入评估网络，经评估网络提取特征后输出与动作空间对应的Q值序列采用ε-greedy策略进行动作选取，即以概率ε为天线分配Q值最大的卫星，以概率1-ε从动作空间中随机选择一颗卫星分配给天线，利用奖励函数计算采取动作aselect获得的奖励Reward1，将状态序列State中动作aselect对应的卫星sselect的状态值Fsselect更新为1，表示该卫星被选择，并生成新卫星状态序列State'；步骤4：将初始卫星的状态序列State、选取的动作aselect、获得的奖励Reward1以及新卫星状态序列State'形成一个四元组State，aselect，Reward1，State'作为一条链路规划经验存入缓冲池；完成一个时间片所有链路规划后，提取缓冲池中的经验，通过计算损失函数和梯度下降法更新评估网络的参数；步骤5：不断重复步骤2-4的训练过程直至评估网络和目标网络收敛；步骤6：利用收敛后的评估网络模型进行低轨巨型星座的星地测控链路的规划分配，获得最终的规划结果。

全文数据：

权利要求：

百度查询：郑州大学一种低轨星座中基于强化学习的星地测控链路规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种冷料仓下料自动补偿装置

下一篇：一种酸碱储槽的酸雾吸收装置

相关技术

一种冷料仓下料自动补偿装置

一种酸碱储槽的酸雾吸收装置

基于多维时序特征的换流变阀侧套管在线绝缘监测方法

一种PE管生产韧性检测设备

一种蓄电池安装架

一种电镀槽挡水装置

一种防堵塞的水泵

一种眼科手术用超声乳化设备

一种降解包装材料的流延加工设备

断路器系统

表壳装配结构和手表

一种油墨储存装置

强化相关技术

强化再生心脏瓣膜_爱德华兹生命科学公司_202080021587.8

一种金属板表面强化装置及其强化方法_成都裕鸢航空智能制造股份有限公司_202411179199.9

弹簧强化抛丸清理机_常州市凯巨弹簧科技有限公司_202323452194.2

多智能体强化学习系统_北京卓翼智能科技有限公司_202411476483.2

由固溶、弥散和细晶强化的协同强化高温高强钼合金及其制备方法和应用_西北工业大学重庆科创中心_202211719719.1

一种车载玻璃化学强化用夹具_广东睿华光学科技有限公司_202420568586.0

一种冷作模具钢表面强化方法_江西省科学院应用物理研究所_202411129476.5

具有实时性的深度强化学习方法_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202411024024.0

弥散强化镍铝青铜及其制备方法_中冶赛迪技术研究中心有限公司_202410997082.5

一种强化微藻多糖提取的方法_韶关学院_202310554391.0

星地相关技术

一种低轨星座中基于强化学习的星地测控链路规划方法_郑州大学_202211455593.1

相位引入型星冕仪系统_临沂大学_202210793975.9

清洁地刷的控制方法、控制器、清洁地刷和存储介质_浙江绍兴苏泊尔生活电器有限公司_202310572871.X

一种星载边端图像重建方法_中国人民解放军国防科技大学_202411465131.7

可拆装式座椅五星脚_安吉县中威办公用品有限公司_202420849550.X

一种节能地源热泵_安徽省国涛科技有限公司_202420171972.6

一种拼接式地垫_深圳市顺而为科技有限公司_202420724660.3

带刮擦结构的地拖布_江苏启运清洁用品织造有限公司_202420154581.3

一种地锚钉_章阳_202411271144.0

一种地暖系统_湖南友风新材料科技有限公司_202420196257.8

学习相关技术

一种学习坐姿及学习休息提醒纠正检测装置_李荷旸_202411293962.0

基于均衡选择及对比学习的含噪声标签图像学习方法与系统_江苏开放大学(江苏城市职业学院)_202410281796.6

数据学习服务器和用于生成和使用其学习模型的方法_三星电子株式会社_202411080834.8

一种基于关系学习的异构联邦子图学习方法_电子科技大学_202411013014.7

基于深度学习电力负荷预测方法_深圳渔航科技有限公司_202411155455.0

多智能体强化学习系统_北京卓翼智能科技有限公司_202411476483.2

波束选择中的机器学习_诺基亚技术有限公司_202380033184.9

一种学习开发板_长沙耀迈智能科技有限公司_202323458725.9

基于机器学习的智能转舵_零度新能源科技(广东)有限公司_202411488117.9

压力应对方式判定系统及方法、学习装置及方法、程序及学习完毕模型_广宣社股份有限公司_202080068209.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种低轨星座中基于强化学习的星地测控链路规划方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务