买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:一种联合大模型和知识图谱的语义感知推荐方法,所述方法包括以下步骤:1构建融合交互数据、知识图谱和文本数据的协同语义知识图谱;2利用大模型从知识图谱的关联文本数据中提取用户和项目的语义特征,建立用户和项目的语义特征向量;3利用多层图注意力网络从知识图谱的关联路径学习基于用户意图的高阶结构特征,生成用户和项目的结构特征向量;4将语义特征向量与结构特征向量深度融合,获得用户和项目的高质量特征表示;5将用户和项目的特征表示进行内积运算,预测用户的感兴趣的项目。本发明联合大模型与知识图谱同时提取用户和项目的语义特征和结构特征,进一步提高了推荐系统的准确性。
主权项:1.一种联合大模型和知识图谱的语义感知推荐方法,其特征在于,所述方法包括以下步骤:1构建协同语义知识图谱定义1:交互数据:在推荐场景下,设表示由M个用户组成的集合,表示由N个项目组成的集合,用户对项目的交互,如点击、购买或查看等,由隐式反馈收集,并表示为一个用户-项目交互矩阵Y∈RM×N,其中yuv=1表示用户u与项目v存在交互,否则yuv=0;定义2:知识图谱:知识图谱以异构图的形式存储涵盖项目属性或外部常识性知识的现实世界事实,定义知识图谱其中h为头实体,r为关系,t为尾实体,和是实体和关系的集合;在推荐场景下,某个项目对应一个实体构建一个项目-实体对齐集合其中v,z表示项目v和知识图谱中的实体对齐,这种对齐使得知识图谱能够为交互数据提供辅助信息;定义3:文本数据:设用户u和k个项目发生交互,根据用户-项目的交互记录,利用用户和项目的原始ID在原始数据集中收集用户u对所有项目的文本评论数据tu,其中tu={c1,c2,...,ck},收集不同用户对项目v的文本评论tv,文本数据集其中{tu,tv}∈T;给定用户-项目交互矩阵Y、知识图谱和文本数据T构建协同语义知识图谱;2利用大模型提取语义特征为确保信息的一致性和质量,用户和项目分别设计了提示模板和指导LLM生成高质量的语义信息,LLM参照提示模板生成特定格式的用户和项目简介,用户简介包含用户偏好的类型和特点,项目简介包含项目的类型、优点、缺点以及推荐理由;将每个用户或项目的文本评论数据或输入到LLM中,利用LLM的上下文理解能力和广泛的数据库资源对海量的文本数据进行增强,生成个性化的用户简介su和项目简介sv,LLM利用文本数据增强语义信息的形式为: 得到用户简介su和项目简介sv后,为了推荐系统能够有效利用语义信息,使用语义编码器将su和sv转化为嵌入向量的形式: 其中是用户u的语义特征表示;是项目v的语义特征表示;是OpenAIEmbedding文本嵌入模型;MLP·是多层感知机,用于将语义特征向量的长度进行统一;3利用多层图注意力网络提取结构特征;4语义特征与结构特征融合采用对比建模的方法对结构特征和语义特征进行双向对齐,其中计算公式为: 其中sin·表示余弦相似度,σ↓是多层感知机,用来将映射到的特征空间;在对齐过程中,将和看作正样本对,通过模型训练使这些正样本对相互靠近,实现特征双向对齐,由此得到用户和项目融合后的嵌入向量eu和ev: 5模型训练将上述得到的用户和项目的嵌入向量进行内积运算,从而预测用户u购买项目v的可能性其中定义如下: 采用贝叶斯个性化排序BPR损失函数对用户交互的正负样本进行建模,假设用户u已经和项目v发生过交互,那么认为用户u更喜欢项目v,而不是未发生交互的其他项目j,将BPR损失函数表示为: 其中是由观察到的正样本对u,v和未观察到的负样本对u,j组成的训练数据集,σ·是sigmoid函数;此外,语义特征和结构特征融合的损失函数定义为: 其中为样本n的负样本语义表示;训练模型的整体损失函数由BPR损失函数、特征融合损失函数和正则化损失函数组成: 其中是模型的参数;λ1和λ2分别是控制特征融合损失函数和正则化损失函数的两个参数;根据上述训练好的语义感知推荐模型为用户推荐个性化项目。
全文数据:
权利要求:
百度查询: 浙江工业大学 一种联合大模型和知识图谱的语义感知推荐方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。