买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:暨南大学
摘要:本发明公开了一种基于双重网络的双重技术关联性分析方法,该方法能够在一个网络系统中嵌入邻近性与组合两类技术关联性,同时可视化技术之间的关联结构,并分析技术之间的多种关联模式。首先,收集相关的技术文档,并对文档中的文本内容进行预处理;其次,通过Word2Vec模型训练获得技术文档中所含词项对应的词嵌入;接着,所得词嵌入和经过预处理后的技术文档作为输入,通过基于ETM的主题建模过程提取出代表不同技术的主题;然后,利用cosine相似度和associationstrength标准化方法测量主题之间的邻近性与组合关联程度;接下来,主题和主题间的邻近性与组合关联分别作为网络中的节点和节点链接构建双重网络。最后,基于多链接构建二维空间用于区分各技术之间的四种关联模式。
主权项:1.一种基于双重网络的双重技术关联性分析方法,其特征在于:包括以下步骤:基于技术文档提取技术关键词,构建技术检索式,基于技术检索式从技术数据库中获取D个原始技术文档;对D个所述原始技术文档中的文本内容进行句子分割和第一次文本预处理,得到预处理后的技术文档句子,基于所述预处理后的技术文档句子,使用词嵌入模型训练,获得D个所述原始技术文档中所含词项对应的词嵌入;基于所述的D个原始技术文档进行第二次文本预处理,得到以词袋形式记录的技术文档;基于所述词嵌入和所述词袋形式的技术文档,通过ETM模型进行主题建模,获得3个结果,所述结果包括主题-词项概率分布矩阵β、文档-主题概率分布矩阵θ和主题嵌入矩阵α;基于主题嵌入矩阵α使用cosine相似度计算公式测量两个主题嵌入间的邻近性,得到记录主题之间邻近性关联程度的邻近性关联矩阵P,基于所述文档-主题概率分布矩阵θ通过associationstrength标准化方法计算得出记录主题之间组合关联程度的组合关联矩阵C,基于邻近性关联矩阵P和组合关联矩阵C,构建得到具有两个网络层次的双重网络并对双重网络进行可视化;基于双重网络中记录主题对关联程度的多链接向量构建二维空间;分别设定邻近性网络层和组合网络层的中划分关联程度强与弱的阈值λp和λc;基于阈值λp和λc将二维空间划分出四个不同的空间区域,判定主题对的四种关联模式,所述四种关联模式包括双重关联、邻近性主导关联、组合主导关联和弱关联;双重网络由超邻接矩阵表示: 其中
全文数据:
权利要求:
百度查询: 暨南大学 一种基于双重网络的双重技术关联性分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。