首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于用户阅读时间行为的新闻推荐方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京工业大学

摘要:本发明公开了一种基于用户阅读时间行为的新闻推荐方法及系统,通过分析用户阅读新闻时的时间信息,为每一位用户生成个性化阅读速度,然后再结合候选新闻的时效性做出推荐。而对于曝光未阅读过的新闻,该方法采用间谍算法来区分其中用户真正不感兴趣的新闻和有潜在兴趣的新闻,从而保证推荐新闻的质量和多样化。本发明解决个性化新闻推荐系统的时效性、标题误导性和推荐内容单一性问题。将每一位用户的阅读时间行为抽象为个性化阅读速度,并引入注意力机制,衡量用户历史点击新闻对候选新闻的不同影响程度;对于曝光过的用户未点击的新闻,引入间谍算法来区分其中用户真正不感兴趣的新闻和用户有潜在兴趣的新闻,从而保证推荐新闻的质量和多样化。

主权项:1.一种基于用户阅读时间行为的新闻推荐方法,其特征在于:该方法包括如下步骤为:步骤1从用户的行为日志中提取用户所阅读新闻的各项信息,包括新闻标题、阅读时长、新闻发布时间;步骤2为每一条提取到的新闻,采用卷积神经网络构建该新闻的个性化表示方式;步骤3通过注意力机制,将不同新闻赋予不同权重;步骤4将用户在一段时间范围内阅读过的所有新闻加权后聚合,用来表示该用户的兴趣方向,以此作为该用户的特征表示;步骤5对于已曝光但用户没有点击的新闻,采用间谍算法查找出用户潜在感兴趣的新闻,和新产生的没有推荐过的新闻一起加入到待推荐的候选新闻中进行处理;步骤6计算候选待推荐新闻与用户特征之间的相似性,对其中相似度较高的新闻进行推荐;在步骤4中,为表示用户对不同新闻的感兴趣程度,引入个性化阅读速度: 其中,表示用户i在阅读j新闻时单位时间的阅读字数,描述用户i阅读j新闻时的阅读速度,表示用户i阅读的所有历史新闻在单位时间内的阅读字数,描述用户i的平均阅读速度;用户阅读速度体现用户对当前新闻的感兴趣程度,个性化阅读速度衡量用户i在阅读j新闻时和平均阅读速度快慢比较;将个性化阅读速度作为用户对新闻兴趣程度的权重之一,得到当前用户的嵌入表示: 对于给定用户i的嵌入表示ei和候选新闻tj的嵌入表示etj,经过相似度计算,计算候选新闻j与用户i的匹配概率为:Dei,etj,又由于新闻具有很强的时效性,新闻的发布时间也作为是否推荐的重要标准,选取新闻时效性系数α,0≤α≤1,则预测用户i点击新闻j的概率为:pi,tj=α*Dei,etj6新闻时效性系数α的取值范围为:发布时间2天时,α=1;2天发布时间5天时,α=0.15;发布时间5天时,α=0;在步骤5中,对于阅读时长为0,即推荐给用户却没有点击的新闻,采用间谍算法,将用户i点击并仔细浏览过的新闻作为正样本集合P,从正样本集合P中随机选取一部分子集S,将S加入到未点击的新闻集合中一起作为负样本集合N,然后训练一个SVN分类模型,用训练之后的分类器给负样本集合N中的样本打分,打分之后计算间谍集合S的平均得分score,由于集合S是用户点击过的新闻,它代表用户的兴趣得分,将负样本集合N中得分低于score的样本划分为负样本,得分高于score的样本不划入负样本中。

全文数据:

权利要求:

百度查询: 北京工业大学 一种基于用户阅读时间行为的新闻推荐方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。