首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于知识图谱的舆情信息推荐方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国标准化研究院

摘要:本发明公开了一种基于知识图谱的舆情信息推荐方法。该基于知识图谱的舆情信息推荐方法属于人工智能技术领域,包括以下步骤:通过Python爬虫实现电影舆情信息的自动抓取、利用自然语言处理技术对自动抓取的电影舆情信息进行预处理、提取出关键实体和关键实体间的关系、构建知识图谱、分析用户的行为数据形成用户的个性化兴趣标签、构建用户兴趣模型、找出与用户兴趣匹配的舆情信息、制定推荐策略、设计用户反馈方法实时调整推荐策略。本发明通过深度学习算法、自然语言处理和个性化推荐技术,达到了推荐信息的多样化以及冷门信息的推荐,解决了现有技术中推荐信息缺乏新颖性的问题。

主权项:1.一种基于知识图谱的舆情信息推荐方法,其特征在于,包括以下步骤:通过Python爬虫实现电影舆情信息的自动抓取;利用自然语言处理技术对自动抓取的电影舆情信息进行预处理;对预处理后的舆情信息进行实体识别和关系抽取,提取出关键实体和关键实体间的关系;基于提取出的关键实体和关键实体之间的关系,构建知识图谱;通过分析用户的行为数据利用机器学习技术挖掘用户的兴趣领域和关注话题形成用户的个性化兴趣标签,根据用户的个性化兴趣标签构建基于陌生人的用户兴趣模型和基于好友的用户兴趣模型,再将基于陌生人的用户兴趣模型和基于好友的用户兴趣模型整合形成完整的用户兴趣模型;基于用户兴趣模型,在知识图谱中查找与用户兴趣相关的电影舆情信息,通过计算实体相似度、关系匹配度找出与用户兴趣匹配的舆情信息;根据用户兴趣模型与电影舆情信息的匹配结果,制定推荐策略,根据用户的个性化需求为用户推荐与用户兴趣匹配的舆情信息,同时,利用探索与利用策略、数据挖掘和文本分析技术为用户推荐话题;设计用户反馈方法,允许用户对推荐结果进行反馈,并根据用户反馈实时调整推荐策略;所述探索与利用策略步骤为:计算用户与冷门电影之间的相似度,采用余弦相似度作为相似度度量指标,定义如下: 式中,I表示相似度,n是特征的总数,ui是用户特征向量u中第i个特征的值,Mi是电影特征向量M中第i个特征的值,i表示特征编号,i=1,2,…,n,u是电影中用户特征向量的编号,M是电影特征向量的编号;所述构建基于陌生人的用户兴趣模型的步骤为:根据用户提取出的实体和关系得出用户感兴趣的主题和领域;将用户感兴趣的主题和领域分别标注不同的个性化兴趣标签;寻找与用户具有相同个性化兴趣标签的其他陌生用户,查看其他陌生用户具有的其他个性化兴趣标签,将用户与其他陌生用户共有数量越多的个性化兴趣标签按照越高的比例推荐相关的舆情信息,将用户不具有但其他陌生用户具有的个性化兴趣标签作为该用户可能感兴趣的领域和话题按照一定比例进行推荐相关舆情信息;所述基于好友的用户兴趣模型的构建步骤为:收集用户的好友列表以及每个好友的兴趣个性化兴趣标签,获取用户个性化兴趣标签与好友个性化兴趣标签相同的个性化兴趣标签并计算用户个性化兴趣标签与好友个性化兴趣标签之间的共现频率,通过共现频率、Pearson相关系数分析好友兴趣个性化兴趣标签之间的关联性和关系紧密程度;根据好友与用户的关系紧密程度,为每个好友的兴趣个性化兴趣标签分配不同的权重,关系越紧密的好友,其权重越大,兴趣标签对用户兴趣模型的影响越大;所述为用户推荐与用户兴趣匹配的舆情信息的步骤为:冷门电影筛选:根据知识图谱中的电影评分和观看人数信息,筛选出冷门电影集合;用户画像构建:根据用户的观影历史、评分、评论信息,构建用户画像,并提取关键特征向量;相似度计算与推荐:计算用户与冷门电影之间的相似度,并根据探索与利用策略融合生成推荐列表,推荐列表中的电影按相似度进行排序;实时更新:根据用户反馈实时更新冷门电影的推荐权重和推荐列表;所述为用户推荐与用户兴趣匹配的舆情信息计算公式如下: 式中,I表示相似度,C表示综合推荐度,Hm是电影热门度,Om是电影冷门度,α是电影热门度的权重,用于调整热门度在推荐中的影响程度,β是电影冷门度的权重,用于调整冷门度在推荐中的影响程度,γ电影新颖性的权重,用于调整电影新颖性在推荐中的影响程度,T表示电影发布至今的时长。

全文数据:

权利要求:

百度查询: 中国标准化研究院 一种基于知识图谱的舆情信息推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。