微软技术许可有限责任公司M·杜迪克获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉微软技术许可有限责任公司申请的专利用于数据的有效使用以用于个性化的系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113994359B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202080043510.0,技术领域涉及:G06Q30/02;该发明授权用于数据的有效使用以用于个性化的系统是由M·杜迪克;A·克里希纳穆尔蒂;M·迪马科波洛;苏怡设计研发完成,并于2020-04-26向国家知识产权局提交的专利申请。
本用于数据的有效使用以用于个性化的系统在说明书摘要公布了:使用基于先前“日志记录”策略而收集的历史数据来执行新“目标”策略的离策略评估,以估计该目标策略的性能。可以使用估计器,其中基于质量的估计器或质量不可知估计器被用于对历史数据中的观察到的奖励与由目标策略生成的估计出的奖励之间的差异进行加权。质量不可知估计器可以用于根据阈值来评估重要性权重。在这样的示例中,当重要性权重超过阈值时,质量不可知估计器在阈值处剪裁重要性权重,从而提供与奖励预测器的质量无关的固定上限。在其他示例中,使用了基于质量的估计器,其中上限结合了奖励预测器的质量,以便修改由估计器使用的重要性权重。
本发明授权用于数据的有效使用以用于个性化的系统在权利要求书中公布了:1.一种系统,包括: 至少一个处理器;以及 存储指令的存储器,所述指令在由所述至少一个处理器执行时,使所述系统执行一组操作,所述一组操作包括: 针对与日志记录策略相关联的历史数据生成奖励预测器,其中所述奖励预测器能够用于基于所述历史数据来生成预期奖励; 确定离策略评估模型,其中所述离策略评估模型包括从由质量不可知估计器和基于质量的估计器组成的估计器组中选择的估计器,其中所述质量不可知估计器包括阈值,并且所述质量不可知估计器使用所述阈值来评估重要性权重; 使用所述离策略评估模型并且基于与所述日志记录策略相关联的所述历史数据来评估目标策略,以确定所述目标策略的预期奖励度量是否高于所述日志记录策略的奖励度量;以及 当确定所述预期奖励度量高于所述日志记录策略的所述奖励度量时,生成使用所述目标策略而不是所述日志记录策略的指示,其中: 第一奖励基于用户完成第一动作被生成,并且第二奖励基于用户完成第二动作被生成;并且 所述奖励预测器被训练以针对给定的上下文生成所述预期奖励。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人微软技术许可有限责任公司,其通讯地址为:美国华盛顿州;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。