首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种两阶段的基于提示学习的评分推荐方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江大学;上海浙江大学高等研究院

摘要:本发明公开了一种两阶段的基于提示学习的评分推荐方法,包括获取用户网上购物的评价数据记录,并构建可学习的语义软提示、数值表示软提示、以及用户语义表示和物品语义表示,在语义提示微调阶段和数值提示微调阶段分别更新两种输入序列和网络的参数,最后利用训练好的模型进行推理,得到用户对所推荐物品的预测分数。本发明的方法利用语义评论和数字评级作为两个不同阶段的监督信号,个性化地将用户表示和用户所购买的物品表示分别分解为语义和数字视角。通过该方法,引导冻结的大语言模型最初推断用户对项目的隐式偏好,然后使用这些有价值的信息生成明确的推荐。

主权项:1.一种两阶段的基于提示学习的评分推荐方法,其特征在于,包括以下步骤:S1.获取用户网上购物的评价数据记录,每条评价数据记录均包含一个用户ID、一个用户所购买的物品ID、一个用户对所购买物品的数字评分和一个与数字评分对应的真实评论文本;S2.获取一个经过预训练的大语言模型,构建可学习的语义软提示、以及用户语义表示和物品语义表示;在语义提示微调阶段的训练中,固定所述大语言模型的参数,将语义软提示、用户语义表示和物品语义表示一起作为所述大语言模型的初始输入序列,由大语言模型输出预测的评论文本,基于预测的评论文本和真实评论文本构建第一交叉熵损失,基于最小化第一交叉熵损失更新初始输入序列的参数,直到达到预设的训练轮次,将初始输入序列更新后的参数保存;S3.当完成语义提示微调阶段的训练后,构建可学习的数值表示软提示、以及用户数值信息表示以及物品数值信息表示并构成额外输入序列,开始进行数值提示微调阶段;在数值提示微调阶段中,将语义提示微调阶段获得的初始输入序列参数固定,固定所述大语言模型的参数,利用所述额外输入序列和所述初始输入序列构建最终输入序列,将最终输入序列先输入到所述大语言模型中,得到初始预测分数和初始预测分数的概率分布,将初始预测分数的概率分布按照数字评分等级提取相应的概率并构成概率向量,将概率向量输入到多层感知机模块中,得到最终预测分数;基于初始预测分数和数字评分构建第二交叉熵损失,基于最终预测分数和数字评分构建均方误差损失,将均方误差损失和第二交叉熵损失加权求和作为总损失,基于最小化所述总损失更新所述额外输入序列和多层感知机模块的参数,直到所述总损失收敛,分别保存额外输入序列和多层感知机模块更新后的参数;S4.获取需要评分推荐的用户ID和需要评分推荐的物品ID,在用户语义表示矩阵中查找用户语义表示,在物品语义表示矩阵中查找物品语义表示,在用户数值信息表示矩阵中查找用户数值信息表示,在物品语义表示矩阵中查找物品语义表示,将更新好的数值表示软提示、更新好的语义软提示、查找到的用户语义表示、查找到的物品语义表示、查找到的用户数值表示、查找到的物品数值表示作为推理输入序列一起输入到所述大语言模型中,得到新的概率向量,将新的概率向量输入到训练好的多层感知机模块中,得到用户对所推荐物品的预测分数,完成基于提示学习的评分推荐。

全文数据:

权利要求:

百度查询: 浙江大学 上海浙江大学高等研究院 一种两阶段的基于提示学习的评分推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。