上海大学;华东计算技术研究所(中国电子科技集团公司第三十二研究所)骆祥峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海大学;华东计算技术研究所(中国电子科技集团公司第三十二研究所)申请的专利一种虚实无缝迁移方法、系统、电子设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116843018B 。
龙图腾网通过国家知识产权局官网在2026-01-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310808639.1,技术领域涉及:G06N3/092;该发明授权一种虚实无缝迁移方法、系统、电子设备及介质是由骆祥峰;张朕煜;谢少荣;王欣芝;逄涛;徐宏;高明柯设计研发完成,并于2023-07-03向国家知识产权局提交的专利申请。
本一种虚实无缝迁移方法、系统、电子设备及介质在说明书摘要公布了:本发明公开一种虚实无缝迁移方法、系统、电子设备及介质,涉及表征学习和强化学习领域,该方法包括:获取虚拟环境下智能体与环境的交互数据;对当前状态的观测进行数据增强;将增强后的观测输入孪生表征网络进行降维,得到向量化状态数据;将向量化状态数据和对应的动作输入孪生价值网络,得到对应的价值;根据向量化状态数据、对应的价值和下一状态的观测,构造表征损失函数;根据表征损失函数,应用梯度下降法,对孪生表征网络、孪生价值网络和决策网络进行训练;当总的训练次数大于预设阈值时,得到训练好的表征网络和决策网络,根据真实环境下的当前状态的观测得到响应于真实环境下的动作。本发明能够提高策略的泛化性能。
本发明授权一种虚实无缝迁移方法、系统、电子设备及介质在权利要求书中公布了:1.一种虚实无缝迁移方法,其特征在于,所述方法包括: 获取虚拟环境下智能体与环境的交互数据;所述交互数据包括当前状态的观测、动作、下一状态的观测和奖励值;其中,所述动作是根据所述当前状态的观测,经过表征网络和决策网络的选择后得到的;所述下一状态的观测和所述奖励值是根据所述动作确定的;所述观测包括图像数据和雷达数据; 对所述当前状态的观测进行数据增强,得到增强后的观测; 将所述增强后的观测输入孪生表征网络进行降维,得到向量化状态数据;所述孪生表征网络包括所述表征网络和与所述表征网络架构相同参数不同的目标表征网络; 将所述向量化状态数据和对应的动作输入孪生价值网络,得到对应的价值;所述孪生价值网络包括价值网络和与所述价值网络架构相同参数不同的目标价值网络; 根据所述向量化状态数据、所述对应的价值和所述下一状态的观测,构造表征损失函数; 根据所述表征损失函数,应用梯度下降法,对所述孪生表征网络、所述孪生价值网络和所述决策网络进行训练,并记录总的训练次数; 判断所述总的训练次数是否大于预设阈值; 当所述总的训练次数小于等于预设阈值时,重新获取虚拟环境下智能体与环境的交互数据,继续训练;当所述总的训练次数大于预设阈值时,得到训练好的表征网络和训练好的决策网络; 获取真实环境下的当前状态的观测,并将真实环境下的所述当前状态的观测输入至所述训练好的表征网络和训练好的决策网络,得到响应于真实环境下的所述当前状态的观测的动作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海大学;华东计算技术研究所(中国电子科技集团公司第三十二研究所),其通讯地址为:200444 上海市宝山区上大路99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励