河南大学侯彦娥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉河南大学申请的专利基于深度强化学习的时序推荐方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114819387B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210536528.5,技术领域涉及:G06Q30/0601;该发明授权基于深度强化学习的时序推荐方法及系统是由侯彦娥;谷文博;党兰学;葛强;何雯雯;左宪禹;刘冰冰设计研发完成,并于2022-05-17向国家知识产权局提交的专利申请。
本基于深度强化学习的时序推荐方法及系统在说明书摘要公布了:本发明提供一种基于深度强化学习的时序推荐方法及系统。该方法包括:根据用户在t时刻的项目集It以及用户信息,生成t时刻的用户状态st;将用户状态st作为训练好的Actor模型的输入信息,得到用户状态st下的推荐动作at;将推荐动作at推荐给用户,并获得对应的用户反馈信息rt;根据用户反馈信息rt得到t+1时刻的用户状态st+1和项目集It+1,并将t时刻对应的推荐动作集合st,at,rt,st+1存储到经验池M以对经验池M进行更新;将用户状态st和推荐动作at作为训练好的Critic模型的输入信息,得到用户状态st下的Q函数值,根据Q函数值和用户反馈信息rt计算得到损失函数值;根据Q函数值和损失函数值,以最新的经验池M作为训练数据更新Actor模型的网络参数和Critic模型的网络参数。
本发明授权基于深度强化学习的时序推荐方法及系统在权利要求书中公布了:1.基于深度强化学习的时序推荐方法,其特征在于,包括: 步骤1:根据用户在t时刻的项目集以及用户信息,生成t时刻的用户状态;其中,所述项目集是指用户浏览过的前n个项目数据;其中,将所述用户状态表示为: 其中,,表示元素乘积,的特征矩阵,表示最大池化层,表示用户特征矩阵; 步骤2:将所述用户状态作为训练好的Actor模型的输入信息,得到所述用户状态下的推荐动作; 步骤3:将所述推荐动作推荐给用户,根据用户对所述推荐动作中所包含的项目进行的操作类型计算对应项目的奖励值,综合所有项目的奖励值得到对应的用户反馈信息; 步骤4:根据所述用户反馈信息得到t+1时刻的用户状态和项目集,并将t时刻对应的推荐动作集合存储到经验池M以对所述经验池M进行更新; 步骤5:将所述用户状态和所述推荐动作作为训练好的Critic模型的输入信息,得到所述用户状态下的Q函数值,根据所述Q函数值和所述用户反馈信息计算得到损失函数值; 步骤6:依据根据所述Q函数值和所述损失函数值,以最新的经验池M作为训练数据更新所述Actor模型的网络参数和所述Critic模型的网络参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河南大学,其通讯地址为:475001 河南省开封市顺河区明伦街85号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。