北京中科院软件中心有限公司王树志获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京中科院软件中心有限公司申请的专利基于镜像的智能体训练系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121303182B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511396897.9,技术领域涉及:G06N3/006;该发明授权基于镜像的智能体训练系统是由王树志;景瑞强;贺兆辉;于兴;焦炼设计研发完成,并于2025-09-28向国家知识产权局提交的专利申请。
本基于镜像的智能体训练系统在说明书摘要公布了:本发明涉及智能体训练技术领域,公开了基于镜像的智能体训练系统。该系统包括训练环境镜像模块、行为特征重构模块及训练决策模型模块。训练环境镜像模块构建与真实物理环境完全同步的虚拟镜像环境,涵盖环境状态参数集合、智能体交互记录序列及性能指标时间序列,可复现真实环境复杂动态场景。行为特征重构模块对智能体交互记录序列做三维行为轨迹解析,生成含决策响应延迟梯度、动作空间覆盖度及协作意图波动系数的行为特征张量,实现多维度行为分析。训练决策模型模块调用预训练智能体演化模型,对行为特征张量进行策略空间映射,生成优化策略参数集及行为缺陷区域标识,助力智能体在真实场景中高效发挥作用。
本发明授权基于镜像的智能体训练系统在权利要求书中公布了:1.一种基于镜像的智能体训练系统,其特征在于,包括: 训练环境镜像模块,用于创建与真实物理环境完全同步的虚拟镜像环境,所述虚拟镜像环境包含环境状态参数集合、智能体交互记录序列及性能指标时间序列; 行为特征重构模块,用于对所述智能体交互记录序列进行三维行为轨迹解析处理,生成智能体行为特征张量,所述智能体行为特征张量包含决策响应延迟梯度、动作空间覆盖度及协作意图波动系数; 训练决策模型模块,用于调用预训练的智能体演化模型对所述智能体行为特征张量进行策略空间映射处理,生成目标智能体的优化策略参数集及行为缺陷区域标识; 所述行为特征重构模块包括: 时空轨迹分割单元,用于将交互事件链按决策周期划分为多个行为片段,每个行为片段对应一个决策响应窗口; 三维特征耦合单元,用于针对每个所述行为片段执行以下处理:基于所述环境状态参数集合构建三维环境拓扑网格,将所述三维环境拓扑网格与动作指令时间戳进行时空关联分析,生成当前决策响应窗口的行为特征分量,所述行为特征分量包含位移响应矩阵、动作选择概率分布及意图识别向量; 特征累积单元,对连续多个决策响应窗口的所述行为特征分量进行聚合计算,输出所述决策响应延迟梯度、动作空间覆盖度及协作意图波动系数; 决策响应延迟梯度反映智能体决策响应时间的变化趋势,动作空间覆盖度表示智能体动作选择的多样性,协作意图波动系数衡量智能体协作意图的稳定性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中科院软件中心有限公司,其通讯地址为:100190 北京市海淀区中关村南四街四号4号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励