买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国科学院软件研究所
摘要:本发明公开了一种基于多维度的网络空间人物画像方法,其步骤包括:1构建网络空间的人物画像体系,所述人物画像体系包括人物的基本信息、个人经历、社交信息、用户标签和社会关系;2对于一目标人物,爬取该目标人物的基本信息和社交信息计算该目标人物的社交影响指数;3获取该目标人物的个人经历;4利用该目标人物的年龄阶段、职业所涉及行业作为目标人物标记身份标签人物标记身份标签;5根据该目标人物在社交媒体Twitter和微博中发布的消息数量,计算权重γTwitter、γWeibo,并计算消息中词语的TF‑IDF值与对应权重相乘,选取TF‑IDF值靠前若干词语作为该目标人物的兴趣标签。
主权项:1.一种基于多维度的网络空间人物画像方法,其步骤包括:1构建网络空间的人物画像体系,所述人物画像体系包括人物的基本信息、个人经历、社交信息、用户标签和社会关系;2对于一目标人物,从百度百科、维基百科爬取该目标人物的基本信息和社交信息;然后从社交信息中获取该目标人物的社交账号和关联人物,并根据社交账号从社交媒体采集该目标人物的用户注册信息、关注与被关注信息、用户发布信息和关注粉丝信息,用于补充该目标人物的社交信息;然后根据该目标人物在社交账号中的相关信息计算该目标人物的社交影响指数;其中,计算得到该目标人物的社交影响指数的方法为:2-1根据该目标人物的社交信息计算用户消息参与度其中n代表该目标人物最近一段时间T内发布的消息数量,SpreDegreei代表第i条消息的传播度,CoNumi代表第i条消息的评论数量,SuNumi代表第i条消息的点赞数量;根据公式SpreDegree=depth×SpreedNumdepth计算消息的传播度;其中depth表示消息的传播深度,SpreedNumdepth表示消息在第depth层转发数量;2-2计算该目标人物的粉丝的认证情况和最新动态评估得出该目标人物的活跃粉丝数ActiveFan′;2-3根据该目标人物在Twitter和微博中的属性信息计算得出该目标人物的用户可信度Reliability;2-4利用层次分析法计算该目标人物的用户消息参与度Participation、活跃粉丝数ActiveFan′、可信度Reliability相对用户影响的权重,分别为wpar,wfan,wrel;2-5计算该目标人物的在Twitter、微博的影响力Influencet∈{Twitter,Weibo}=wpar×Participation+wfan×ActiveFan′+wrel×Reliability;2-6基于D-S理论构建用户社交影响指数评估框架,将该目标人物在Twitter和微博中的影响力分别做归一化处理后作为用户社交影响指数评估框架的基本信任分配;2-7利用D-S理论中的合成法则分别对该目标人物在社交媒体Twitter下的基本信任与该目标人物在微博下的基本信任进行合成,将合成后的结果作为该目标人物的用户社交影响指数Influence;3依据该目标人物的姓名、所在单位搜集人物简历,获取该目标人物的个人经历;4利用该目标人物的年龄阶段、职业所涉及行业作为目标人物标记身份标签;5根据该目标人物在社交媒体Twitter中发布的消息数量,计算社交媒体Twitter相对于该目标人物的权重γTwitter,并计算该目标人物在社交媒体Twitter中发布的消息中词语的TF-IDF值,选取TF-IDF值靠前的N个词语Twitter_Wordsw1,w2,…,wN,然后将所选N个词语的TF-IDF值与权重γTwitter相乘,得到更新后的词语TF-IDF值;6根据该目标人物在微博中发布的消息数量,计算微博相对于该目标人物的权重γWeibo,并计算该目标人物在微博中发布的消息中词语的TF-IDF值,选取TF-IDF值靠前的N个词语Weibo_Wordsw1,w2,…,wN;然后将所选N个词语的TF-IDF值与权重γWeibo相乘,得到更新后的词语TF-IDF值;7根据步骤5、6所得更新后的词语TF-IDF值对词语进行排序,选取TF-IDF值靠前若干词语作为该目标人物的兴趣标签。
全文数据:
权利要求:
百度查询: 中国科学院软件研究所 一种基于多维度的网络空间人物画像方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。