Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东北大学赵羽茜获国家专利权

东北大学赵羽茜获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东北大学申请的专利一种基于知识图谱和强化学习的交互式推荐方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115186097B

龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210017981.5,技术领域涉及:G06F16/36;该发明授权一种基于知识图谱和强化学习的交互式推荐方法是由赵羽茜;张明卫设计研发完成,并于2022-01-07向国家知识产权局提交的专利申请。

一种基于知识图谱和强化学习的交互式推荐方法在说明书摘要公布了:本发明提供一种基于知识图谱和强化学习的交互式推荐方法,涉及交互式推荐技术领域。从建模整个交互式推荐过程角度出发,结合图注意力机制,语义相似性、结构相似性,加入好奇心机制,有效建模推荐过程并提高推荐性能指标,构建训练稳定且方差小的模型。克服现有模型中物品相关信息少,未参考邻居信息以及训练过程的候选集巨大造成的算法效率低下,同时提出了新的奖励设定机制。采用了双网络结构训练,加入了防止过拟合的优化设计,并设置了引入好奇心机制的奖励模拟器,从评分,知识图谱中节点距离,好奇心机制三个维度给出奖励的准则,并加入了减少策略方差的机制,模型训练稳定且效率显著提升。

本发明授权一种基于知识图谱和强化学习的交互式推荐方法在权利要求书中公布了:1.一种基于知识图谱和强化学习的交互式推荐方法,其特征在于,包括: 步骤1:将推荐数据集中的物品与知识库Freebase中的实体进行对应,构建得到特定领域知识图谱,根据构建的知识图谱,对知识图谱进行预嵌入得到知识图谱中实体和关系的低维表示,即实体映射到超平面的映射; 步骤2:计算知识图谱中的实体节点与其一阶邻居实体节点之间的注意力系数,利用计算得到的注意力系数与步骤1得到的实体低维表示,以加权求和的计算方式得到传播了一阶邻居实体节点的中心实体低维表示; 步骤3:对步骤1得到的实体低维表示与步骤2得到的传播了一阶邻居实体节点的中心实体低维表示进行集成,集成操作所得到的实体节点表示将作为下一轮实体低维表示,重复步骤2以及本步骤操作,直至实体节点嵌入表示收敛; 步骤4:从步骤3得到的实体节点表示中取出用户有过正向交互过的物品表示,输入至GRU模型得到用户即时偏好向量,即状态; 步骤5:以用户有过正向交互的物品为中心,选取知识图谱的k跳邻居实体节点作为候选空间集合,即动作空间; 步骤6:将步骤4得到的状态和步骤5得到的动作空间输入至策略网络,并得到动作向量;其中所述策略网络是由多层感知机构成的,其输出待推荐的动作高维向量表示; 步骤7:将步骤6输出的动作向量输入到奖励模拟器得到奖励,若奖励大于预设阈值,则将此动作向量加入至此用户的有过交互的物品中,并重新利用步骤4的计算过程得到下一步状态;若奖励小于等于预设阈值,则下一步状态保持和上一步状态不变; 步骤8:将步骤4得到的状态,步骤6得到的动作向量,步骤7得到的奖励,步骤4得到的下一步状态存储在经验池中,基于强化学习中的PPO2算法构建推荐智能体模型,智能体以试错的方式得到训练数据并获得最优的行为策略,以交互式的形式利用用户当下即时反馈调整推荐策略。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北大学,其通讯地址为:110819 辽宁省沈阳市和平区文化路3号巷11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。