买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京邮电大学
摘要:本发明提出了一种基于迁移头尾知识的神经协同过滤双向推荐方法,通过双向评分数据客体与主体的双边交互流行度进行分类采样,再将评分数据进行归一化后,加深了长尾项目表示的同时,防止聚合后单向评分数据长尾现象更加严重的情况。通过构建双向的最近邻居特征矩阵,将客体和主体的双边最近邻居特征结合神经协同过滤嵌入层对应的客体和主体特征,继续输入神经网络中进行训练,充分挖掘双向客体和主体之间的局部特征信息。通过用全连接层F网络学习客体‑主体及主体‑客体头部项目从少样本模型到多样本模型过程中神经协同过滤网络参数的变化,迁移应用到长尾项目中,提高双向长尾项目的推荐。
主权项:1.一种基于迁移头尾知识的神经协同过滤双向推荐方法,其特征在于:所述神经协同过滤双向推荐方法包括如下步骤:步骤1:采集客体-主体以及主体-客体的双向评分数据,进行归一化预处理;步骤2:分别计算所述客体-主体以及主体-客体评分数据的相似度矩阵,得到两个客体相似度矩阵和两个主体相似度矩阵;步骤3:分别对步骤1中所述客体-主体以及主体-客体评分数据进行矩阵分解训练,得到对应的客体特征矩阵和主体特征矩阵,根据步骤2中得到的两个客体相似度矩阵和两个主体相似度矩阵,将每个客体最近邻居在所述两个客体特征矩阵中所对应的向量,组成客体最近邻居特征矩阵,将每个主体最近邻居在所述两个主体特征矩阵中所对应的向量,组成主体最近邻居特征矩阵;步骤4:分别计算所述客体-主体以及主体-客体评分数据中客体主体的流行度,根据客体主体流行度不同进行采样,再将双向评分数据赋予不同权重组合成新的客体-主体评分数据和新的主体-客体评分数据;步骤5:将步骤4获得的新的客体-主体评分数据多次分为少样本数据集和多样本数据集,输入神经协同过滤推荐网络,得到各自的客体,主体嵌入特征,再与所述对应的最近邻居特征向量拼接,继续输入神经网络中训练参数;步骤4获得的新的主体-客体评分数据多次分为少样本数据集和多样本数据集,输入神经协同过滤推荐网络,得到各自的主体,客体嵌入特征,再与所述对应的最近邻居特征向量拼接,继续输入神经网络中训练参数;步骤6:使用全连接层作为F的映射网络,学习神经协同过滤推荐网络参数从客体-主体少样本到多样本数据集训练的变化;使用全连接层作为F的映射网络,学习神经协同过滤推荐网络参数从主体-客体少样本到多样本数据集训练的变化;步骤7:利用训练好的所述神经协同过滤推荐网络生成客体对主体的评分以及主体对客体的评分,聚合双向评分,对模型的性能进行评估,其中:在所述步骤4中:获取新的客体-主体评分数据,包括如下步骤:计算客体-主体评分数据的每个主体流行度及主体-客体评分数据每个客体流行度,计算公式如下:客体流行度:ppki=ln1+|Ni|主体流行度:ppzu=ln1+|Nu|其中,Ni为偏好该客体的主体数,Nu为偏好该主体的客体数;将客体-主体评分数据得到的主体流行度ppzu大于等于k值的主体看作头部主体,小于k的看作长尾主体,将主体-客体评分数据中每个主体偏好的客体按照客体流行度ppki从大到小排序,选取主体-客体评分数据中长尾主体的前k个客体交互数据,选取主体-客体评分数据中头部主体的前个客体交互数据,加权结合更新客体-主体评分,得到新的客体-主体评分矩阵,计算公式如下: 其中,为客体对主体的偏好评分,yui为主体对客体偏好评分,α为权重系数;获取新的主体-客体评分数据,包括如下步骤:计算主体-客体评分数据的每个客体流行度及客体-主体评分数据每个主体流行度,计算公式如下:客体流行度:ppki=ln1+|Ni|主体流行度:ppzu=ln1+|Nu|其中,Ni为偏好该客体的主体数,Nu为偏好该主体的客体数;将主体-客体评分数据得到的客体流行度ppki大于等于k值的客体看作头部客体,小于k的看作长尾客体,将客体-主体评分数据中每个客体偏好的主体按照主体流行度ppzu从大到小排序,选取客体-主体评分数据中长尾客体的前k个主体交互数据,选取客体-主体评分数据中头部客体的前个主体交互数据,加权结合更新主体-客体评分,得到新的主体-客体评分矩阵,计算公式如下: 其中,为主体对客体的偏好评分,yiu为客体对主体偏好评分,α为权重系数;所述步骤5中,所述客体-主体少样本数据集和多样本数据集的构成包括:多样本客体-主体数据集包含了来自头部和尾部主体的所有客体反馈,少样本客体-主体数据集由长尾主体的全部交互记录及每个头部主体随机抽样的t条记录组成;所述主体-客体少样本数据集和多样本数据集的构成包括:多样本主体-客体数据集包含了来自头部和尾部客体的所有主体反馈,少样本主体-客体数据集由长尾客体的全部交互记录及每个头部客体随机抽样的t条记录组成;所述步骤5中,所述神经协同过滤推荐网络对客体-主体数据集训练流程包括:步骤5-1-1:给定目标客体i和主体u,神经协同过滤推荐方法表示为:其中,表示客体i和主体u之间的预测分数;θ表示模型参数;g表示映射函数;步骤5-1-2:使用所述客体-主体数据集作为原始输入,经过独热编码后,转变为模型能够直接处理的输入向量,然后利用线性的嵌入层,将高维、稀疏的输入向量转换为低维、稠密的表示向量,从而得到客体i和主体u的嵌入向量,使用嵌入整合层,将嵌入向量与所述对应的最近邻居向量两类表示向量整合在一起,形成客体与主体最终的表示向量vi和vu;步骤5-1-3:对于矩阵分解MF部分,将vi和vu进行元素积得到矩阵分解输出向量对于多层感知器MLP部分,将vi和vu拼接起来,得到输入向量viu,再将viu输进多层感知器中,去学习客体与主体之间的交互函数,得到多层感知器的输出向量步骤5-1-4:由将矩阵分解和多层感知器两个部分的输出向量拼接起来,输入一个全连接层中,得到客体i和主体u之间的预测分数,其中,h为输出层的权重向量;b表示输出层的偏置项;σ·为Sigmoid函数,利用作为损失函数,其中θ为模型参数;所述神经协同过滤推荐网络对主体-客体数据集训练流程包括:步骤5-2-1:给定目标主体u和客体i,神经协同过滤推荐方法表示为:其中,表示主体u和客体i之间的预测分数;θ表示模型参数;g表示映射函数;步骤5-2-2:使用所述主体-客体数据集作为原始输入,经过独热编码后,转变为模型能够直接处理的输入向量,然后利用线性的嵌入层,将高维、稀疏的输入向量转换为低维、稠密的表示向量,从而得到主体u和客体i的嵌入向量,使用嵌入整合层,将嵌入向量与所述对应的最近邻居向量两类表示向量整合在一起,形成主体与客体最终的表示向量vu和vi;步骤5-2-3:对于矩阵分解MF部分,将vu和vi进行元素积得到矩阵分解输出向量对于多层感知器MLP部分,将vu和vi拼接起来,得到输入向量vui,再将vui输进多层感知器中,去学习客体与主体之间的交互函数,得到多层感知器的输出向量步骤5-2-4:由将矩阵分解和多层感知器两个部分的输出向量拼接起来,输入一个全连接层中,得到主体u和客体i之间的预测分数,其中,h为输出层的权重向量;b表示输出层的偏置项;σ·为Sigmoid函数,利用作为损失函数,其中θ为模型参数;在所述步骤6中,利用F获取所述神经协同过滤模型在少样本到多样本数据集训练过程中的参数变化,包括:步骤6-1:使用一个全连接层作为F的映射网络去学习所述客体-主体神经协同过滤推荐网络最后一层参数,利用此公式为多样本数据集,argmin为最小化损失函数,从而得到多样本模型参数θ*;步骤6-2:利用损失函数学习客体-主体少样本模型到多样本模型的参数变化,其中,为客体-主体少样本数据集,为客体-主体多样本数据集;Fθ;ω使用参数ω学习从所述少样本模型参数到多样本模型参数的元映射,它的输入是神经协同过滤推荐模型在训练出的参数θ,λ是平衡这两项的正则化参数,‖Fθ;ω-θ*‖2将预测的多样本模型参数通过Fθ;ω和多样本模型参数θ*之间的距离最小化,基于训练数据集对神经协同过滤推荐网络进行训练,保证数据的高推荐性能,同时帮助学习Fθ;ω;步骤6-3:使用一个全连接层作为F的映射网络去学习主体-客体神经协同过滤推荐网络最后一层参数,利用此公式求得多样本模型参数;步骤6-4:然后利用损失函数学习主体-客体少样本模型到多样本模型的参数变化,为主体-客体少样本数据集,为主体-客体少样本数据集。
全文数据:
权利要求:
百度查询: 南京邮电大学 基于迁移头尾知识的神经协同过滤双向推荐方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。