买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳市查策网络信息技术有限公司
摘要:本发明适用于新闻推荐技术领域,尤其涉及一种多源融合新闻内容智能推荐方法及系统,所述方法包括:获取用户历史浏览记录,基于用户历史浏览记录构建用户数据库;获取新闻合集,基于用户数据库对新闻合集进行筛选,筛选出待推送新闻;采用TF‑IDF模型对待推送新闻进行关键词提取,得到各个待推送新闻的新闻关键词,基于新闻关键词进行扩展信息采集,得到多源扩展信息;基于用户数据库对多源扩展信息进行筛选,将筛选后的多源扩展信息融合至待推送新闻中,得到多源融合新闻。本发明根据从多个数据来源采集到的扩展信息对待推送新闻进行改写,得到多源融合新闻,实现了对用户的适应性内容修改,使得新闻内容更能贴合用户的阅读习惯。
主权项:1.一种多源融合新闻内容智能推荐方法,其特征在于,所述方法包括:获取用户历史浏览记录,基于用户历史浏览记录构建用户数据库,所述用户数据库包括偏好关键词库、中性关键词库和排斥关键词库;获取新闻合集,基于用户数据库对新闻合集进行筛选,筛选出待推送新闻,所述待推送新闻至少包括偏好新闻以及无分类新闻;采用TF-IDF模型对待推送新闻进行关键词提取,得到各个待推送新闻的新闻关键词,基于新闻关键词进行扩展信息采集,得到多源扩展信息;基于用户数据库对多源扩展信息进行筛选,将筛选后的多源扩展信息融合至待推送新闻中,得到多源融合新闻;获取新闻合集,基于用户数据库对新闻合集进行筛选,筛选出待推送新闻,所述待推送新闻至少包括偏好新闻以及无分类新闻的步骤,具体包括:基于关键词出现的频次确定用户数据库中各个关键词的偏好贡献度,将不包含偏好关键词库和排斥关键词库中关键词的新闻划分为无分类新闻;对新闻合集中各个新闻进行逐字读取,确定该新闻对应的综合贡献度点阵;基于综合贡献度点阵构建贡献度曲线,计算贡献度曲线上各点的斜率,基于斜率对新闻合集进行分类,得到偏好新闻,贡献度曲线上斜率低于预设斜率的曲线占比小于预设值的新闻为偏好新闻,无分类新闻和偏好新闻均属于待推送新闻;所述基于用户数据库对多源扩展信息进行筛选,将筛选后的多源扩展信息融合至待推送新闻中,得到多源融合新闻的步骤,具体包括:对多源扩展信息进行关键词提取,得到扩展信息关键词;根据拓展信息关键词计算各个要素对应的多源扩展信息的扩展贡献度,基于扩展贡献度对多源扩展信息进行筛选,得到待融合多源信息;识别待推送新闻中的各个关键词,将对应的待融合多源信息添加至对应的位置,得到多源融合新闻;将筛选后的多源扩展信息融合至待推送新闻中的步骤中,对用户历史浏览记录进行统计,统计用户浏览新闻中不同新闻要素的时间值,构建浏览时间坐标,浏览时间坐标的横轴为阅读新闻的次数,纵轴为浏览该新闻中某个新闻要素的时间值,基于浏览时间坐标构建要素浏览预测函数,根据浏览预测函数生成各个新闻要素的预测浏览时长,基于预测浏览时长的比例确定各个新闻要素对应的多源扩展信息融入待推送新闻的比例,对多源扩展信息进行融合。
全文数据:
权利要求:
百度查询: 深圳市查策网络信息技术有限公司 一种多源融合新闻内容智能推荐方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。