一种融合强化和对比学习的个性化习题推荐方法与推荐系统

导航：龙图腾网> 最新专利技术> 一种融合强化和对比学习的个性化习题推荐方法与推荐系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明公开了一种融合强化和对比学习的个性化习题推荐方法，所述方法使用自监督强化学习方法，将习题推荐过程形式化为马尔可夫决策过程，在学生和智能体之间进行交互作用，获得特征表示；同时融入对比学习思想，将相似的学习历史拉拢，不同的学习历史分开，以此来学习有效表征；对隐藏状态进行拼接，得到拼接后的表征和进一步得到整个习题和交互历史表示；将和作为输入，通过Q值函数计算、拼接，以得到最终的Q值；然后通过自监督强化学习方法，使累积奖励最大化；结合自监督、强化和对比学习损失，使用梯度下降进行模型训练，利用模型得到最终的习题推荐结果，向学生推荐更适合的习题。本发明还公开了实现上述方法的系统。

主权项：1.一种融合强化和对比学习的个性化习题推荐方法，其特征在于，所述方法包括如下步骤：步骤一，选取数据集，并对数据集进行预处理；步骤二，对原始的学生历史序列进行数据增强，采用问题掩码mask、重新排序交互permute、问题替换replace这三种数据增强方法结合的方式，得到原始学习历史的两个相关视图表示，即u+1,u+2；步骤三，将原始学生历史序列和增强后的序列输入嵌入层，分别得到习题和学生-习题交互向量的特征表示；步骤四，根据步骤三中获得的习题、交互向量特征表示，使用包括GRU和或SASRec和或NextItNet和或Bert4Rec在内的可集成的序列推荐模型对习题和交互向量进行编码得到相应的隐藏表征；步骤五，将步骤四中得到的隐藏状态进行拼接，得到原始习题和交互序列拼接后的表征以及经过数据增强的习题与交互序列拼接后的表征和步骤六，根据步骤四得到数据增强后的习题及交互的隐藏表示后，经过平均池化层，得到整个习题和交互历史表示；步骤七，将步骤五中得到的潜在表示和作为输入，通过Q值函数获得每个输入相应的Q值，并进行拼接，以得到最终的Q值；然后通过自监督强化学习方法，使累积奖励最大化；步骤八，结合自监督、强化和对比学习损失，使用梯度下降进行模型训练，将得到的学生表征，通过一个自监督头，得到最终的习题推荐结果，向学生推荐更适合的习题。

全文数据：

权利要求：

百度查询：华东师范大学一种融合强化和对比学习的个性化习题推荐方法与推荐系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于多层环保袋生产线的码垛机械手

下一篇：一种重油雾化空气辅助缸内直喷系统

相关技术

一种基于多层环保袋生产线的码垛机械手

一种重油雾化空气辅助缸内直喷系统

用于人体运动信号多重监测的表皮传感器及其制备方法

一种畜牧用草料切割装置

一种橡胶用粘合剂、混炼胶及其制备方法

一种获取延时预留比的方法、电子设备及存储介质

一种全氟异丁基甲醚的制备方法

一种角度测量方法、装置和系统

基于云网络的数据流传输控制方法、装置及设备

一种基于PLC的安检输送线

一种用于锂电池EIS检测的单电感多输入单输出DC-DC系统及其控制方法

多层包覆富锂锰正极材料及其制备方法、正极片和电池

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种融合强化和对比学习的个性化习题推荐方法与推荐系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务