首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种社交平台上特定地域的媒体账号发现方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国家计算机网络与信息安全管理中心

摘要:本发明提出一种社交平台上特定地域的媒体账号发现方法及系统。在解决社交平台上特定地区媒体账号发现任务时,发明人发现已有方法难以快速地获取高质量的种子媒体账号信息,因此设计了一套针对种子媒体账号快速标注的方法,包括候选账号的确定与账号分类。发明人发现已有方法的特征设计存在特征较弱、无法体现媒体账号特性、难以大规模实施等问题,因此设计了针对媒体账号特性的特征抽取方法。该方法速度快、抽取的特征强。发明人发现已有方法难以高效、高质量地从种子账号扩充到更多的媒体账号。因此在解决了种子账号标注与特征抽取方法的基础上,设计了两种互为补充的扩充方法以获取高质量、高数量的媒体账号。

主权项:1.一种社交平台上特定地域的媒体账号发现方法及系统,其特征在于,包括:步骤1、获取社交平台上特定地域的所有账号,从所有账号中筛选出影响力大于阈值的媒体账号作为原始账号,并对各原始账号进行媒体类型标注;步骤2、对原始账号进行特征提取,得到原始账号的多个特征;该步骤2包括:基于用户名中是否具有媒体类型关键词和地域名称限定词,提取用户名特征;基于账号的粉丝数-关注数比率、关注数-粉丝数比率、账号简介字段是否存在外链、简介字段是否存在媒体类型关键词与账号在该社交平台的注册时长,提取用户资料特征;分别计算账号的三种行为类型所占比率作为用户基础行为特征,该三种行为类型包括自发行为比率、转发行为比率以及评论行为比率;融合该用户基础行为特征、该用户资料特征和该用户名特征作为账号的特征信息;步骤3、以原始账号及其对应的特征作为训练数据,原始账号的媒体类型作为训练目标,训练基于机器学习的分类模型,得到各媒体类型对应的分类器;步骤4、将原始账号在该社交平台上主动交互的账号作为候选账号,利用该分类器对该候选账号进行媒体账号判别与地域过滤,将位于该特定地域且属于媒体账号的候选账号加入媒体账号集合;步骤5、将该媒体账号集合中的账号作为新一轮的候选账号,重复执行该步骤4,直到重复此处达到阈值或媒体账号集合不加入新的账号,保存当前媒体账号集合并加入所有原始账号作为第一集合;步骤6、对该社交平台上特定地域所有账号中未被标注的账号,利用该分类器将属于媒体的账号加入第二集合;步骤7、合并该第一集合和该第二集合,作为该社交平台上特定地域的媒体账号发现结果。

全文数据:

权利要求:

百度查询: 国家计算机网络与信息安全管理中心 一种社交平台上特定地域的媒体账号发现方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。