首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

IDF模型协同过滤模型的电影推荐方法、介质、设备及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安建筑科技大学

摘要:IDF模型协同过滤模型的电影推荐方法、介质、设备及系统,包括以下步骤:采集电影推荐中影响因子的用户数据集;对用户数据集中相关影响因素数据通过作为深度置信网络DBN的输入,来进行数据预处理;将预处理之后的数据输入到复合多粒度扫描IDF模型中并进行训练;将得到的特征向量进行拼接,得到用户‑电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。通过将采集的数据集进行多粒度扫描,针对电影推荐系统所处理数据结构的复杂性与电影与用户间的信息交互传递的特性,借鉴随机取样原则,保证在一定时间内,总体范围内的每个样本对象都能以确定、非零的概率被选择并作为所要研究的对象,保证了所需要选取样本的代表性。

主权项:1.IDF模型协同过滤模型的电影推荐方法,其特征在于,包括以下步骤:采集电影推荐中影响因子的用户数据集,包括电影数据、评分数据和用户数据;对用户数据集中相关影响因素数据通过作为深度置信网络DBN的输入,来进行数据预处理;将预处理之后的数据输入到复合多粒度扫描IDF模型中并进行训练,训练完毕得到用户和电影的特征向量;将得到的特征向量进行拼接,得到用户-电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果;M表示男性,F表示女性,将标示性别的“F”和“M”转换为1和0;将年龄化为七个年龄分段,七个分段转换为0、1、2、3、4、5、6七个整数;电影类别字段使用一位有效编码,将类别字段转化为整数值,用二进制向量来表示整数值;电影名称与电影类别一样创建将文本转化为字符串之后再转化为数字的字典;将转化后的数据作为深度置信网络DBN的输入,来进行数据预处理;DBN的训练过程包含两个阶段:无监督的预训练和有监督的微调阶段;预训练阶段:采用RBM逐层进行预训练,直接将数据输入到最底层RBM的可见层进行训练,从该层输出的数据直接输入到DBN的输入层,作为下一层的输入;直至完成DBN的预训练;微调阶段:有监督的微调训练要前向传播算法得到输出数据和后向传播算法得到偏置值和权重值;使用复合多粒度扫描IDF数据进行特征提取,假设长度为n的一维特征向量,通过长度为m的滑动窗口进行扫描,并规定滑动窗口的滑动步距为1个单位长度,则结果包含n-m+1个具有m维特征向量的数据子集Fi;每次窗口滑动同时随机捕获相同维度的特征向量数据子集Fm,进而将两者合并构成n-m+1个具有2m维特征向量的数据子集Gi,如下公式所示:Gi=Fi∪Fm,i∈1,…,n-m+1对于一个n×n的二维数据采取相同的方式获取样本的特征向量数据子集,将两者复合得到了用户和电影特征向量数据子集;用得到的用户和电影特征向量来拟合用户—电影评分矩阵,计算用户、电影特征之间的相关度simuser-item:首先,构建以喜好、浏览记录、评分、收藏为主的用户—电影评分矩阵,用户集合为包含N个用户的集合U={u1,u2,…,uN},电影集合为包含M个电影的集合I={i1,i2,…,i3};每一位用户ui∈U都对至少一个电影进行了评价,评价结果以分值形式记录为RNM;所构成的用户-电影评分矩阵为: 上式中,行ri表示用户所评价电影集合,列rj表示评价这部电影的用户集合,rij为用户评分;其次,根据用户-电影评分矩阵利用余弦相似度计算用户之间的相似度,余弦相似度就是将矩阵RNM中的第u、v行认定为向量a和b;用户u、v之间的相似度由向量a和b夹角的余弦值来定义; 然后,将用户与其他用户的最近邻居KNN通过用户之间的近似度得到,通过KNN设定的选择阈值选择前N个相似度最高的邻居;协同过滤模型接下来对预测进行输出,首先将前N个相似度最高的邻居喜欢的电影进行筛选,并将剩余的电影集合起来,构成电影候选集,接下来通过加权求和的计算方法对用户和电影进行预测评分;加权求和方法就是通过加权的方法对用户和所有与电影集中电影i的电影的评分进行求和来得到目标用户对电影i预测评分,将排序靠前的前几部电影作为推荐项推荐给用户。

全文数据:

权利要求:

百度查询: 西安建筑科技大学 IDF模型协同过滤模型的电影推荐方法、介质、设备及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。