首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于文本特征整合的语义社交网络多视角社区发现方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨理工大学

摘要:本发明公开了一种基于文本特征整合的语义社交网络多视角社区发现方法,包括:抓取社交网络中用户发表语义信息;提取语义信息中预设数量的词频特征构建矩阵;对语义信息进行TF‑IDF值计算,提取预设数量的关键字特征构建矩阵;利用LDA主题模型获取语义信息的主题和每位用户的主题分布构建矩阵;利用Pearson相关系数求解上述矩阵之间的相似度矩阵,并与预设阈值进行比较,若大于则建立连接重构原社交网络,得到语义社交网络;利用基于图学习的多视角聚类算法对语义社交网络进行多视角社区发现,得到社区划分结果。该方法从多个视角考虑社交网络的语义信息再进行社区发现,保证社区结构划分结果的高质量、高准确度和高凝聚性。

主权项:1.一种基于文本特征整合的语义社交网络多视角社区发现方法,其特征在于,包括以下步骤:步骤S1,抓取社交网络中用户发表语义信息,并对所述语义信息进行预处理,得到初始语义信息;步骤S2,对所述初始语义信息进行词频特征提取,选取预设数量的词频特征,以构建词频向量矩阵;步骤S3,对所述初始语义信息进行TF-IDF值计算,提取预设数量的关键字特征,以构建关键字向量矩阵;步骤S4,利用LDA主题模型获取所述初始语义信息的主题和每位用户的主题分布,以构建主题向量矩阵;步骤S5,将所述词频向量矩阵、所述关键字向量矩阵和所述主题向量矩阵堆叠形成数据矩阵,利用Pearson相关系数求解数据矩阵中所述词频向量矩阵、所述关键字向量矩阵和所述主题向量矩阵之间的相似度矩阵,并与预设阈值进行比较,若大于则建立连接重构原社交网络,得到语义社交网络,反之则不连接;以及步骤S6,利用基于图学习的多视角聚类算法对所述语义社交网络进行多视角社区发现,得到社区划分结果;所述步骤S6具体包括:步骤S601,基于图学习的多视图聚类算法对所述语义社交网络进行多视角社区发现,通过自适应每一个视角的权重,学习得到多个视角融合后的最终矩阵;步骤S602,利用秩约束使所述最终矩阵的连通分量数正好为社区结构数;所述步骤S602的目标函数为: 其中,为第个视角的相似度矩阵的第列,为的权重,为相似度矩阵的行或列数,为最终矩阵的第列,为视角个数,为权衡参数,为聚类指示矩阵,为最终矩阵的Laplacian矩阵,为社区结构数,为全为1的向量。

全文数据:

权利要求:

百度查询: 哈尔滨理工大学 基于文本特征整合的语义社交网络多视角社区发现方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。