买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉光谷联合集团有限公司
摘要:本发明提出了一种基于产业云的企业画像构建方法,属于数据处理领域,包括:S1、采集产业云内企业当前的多源原始数据,并对所述多源原始数据进行数据预处理,得到处理后的多源异构数据;S2、对所述处理后的多源异构数据数据进行数据融合,得到第一数据集;S3、构建本体模型,根据所述本体模型和第一数据集构建初始企业知识图谱;S4、对所述初始企业知识图谱进行补全;S5、根据所述补全后的企业知识图谱提取企业特征,并根据所述企业特征构建企业画像。本申请通过构建初始企业知识图谱,并对初始企业知识图谱进行补全,填补了信息缺失,提升了初始企业知识图谱表达的全面性和准确性,通过提取初始企业知识图谱的企业特征并构建企业画像,全面描述了企业的属性和特征,提高了企业数据整合、分析和利用的效率。
主权项:1.一种基于产业云的企业画像构建方法,其特征在于,包括以下步骤:S1、采集产业云内企业当前的多源原始数据,并对所述多源原始数据进行数据预处理,得到处理后的多源异构数据;S2、对所述处理后的多源异构数据进行数据融合,得到第一数据集;S3、构建本体模型,根据所述本体模型和第一数据集构建初始企业知识图谱;S4、对所述初始企业知识图谱进行补全,得到补全后的企业知识图谱;S5、根据所述补全后的企业知识图谱提取企业特征,并根据所述企业特征构建企业画像;步骤S5具体包括:S51、对补全后的企业知识图谱中的所有实体进行遍历,计算任意两个实体之间的相关性权重,并根据所述相关性权重构建链接搜寻权重矩阵;其中,相关性权重的计算公式如下: ;其中,表示实体i和实体j之间的介数中心性,表示指数函数;S52、根据所述链接搜寻权重矩阵分别提取实体的特征,形成综合特征向量集;S53、根据综合特征向量集构建实体画像,将所述实体画像存储在一个画像矩阵中,得到企业画像矩阵;步骤S52具体包括:S521、根据所述链接搜寻权重矩阵分别提取实体的属性特征、关联边特征、上下文特征和隐藏特征;其中,所述属性特征的计算公式如下: ; 表示第i个实体的属性集,表示编码函数;所述关联边特征的计算公式如下: ; 是表示两个实体之间的相关性权重,表示相邻两个实体的嵌入表示,E表示企业知识图谱中所有实体的集合,表示E中其他实体;所述上下文特征的计算公式如下: ; 表示围绕第i个实体的文本上下文,表示使用BERT模型将输入的上下文文本转换为高维向量;所述隐藏特征的计算公式如下: ;其中,表示激活函数,表示连接函数,表示隐藏特征可学习的权重矩阵,表示隐藏特征可学习的偏置项;S522、将所述隐藏特征使用全连接层转换为高维向量,并与上下文特征进行融合,得到第一实体综合特征;所述第一实体综合特征的计算公式如下: ;其中,表示门控权重,范围为(0,1),表示多层感知机;S523、使用全连接层改变第一实体综合特征的维度,并与实体的属性特征和关联边特征进行合并得到实体综合特征向量,并形成综合特征向量集;其中,所述综合特征向量的计算公式如下: ;其中,表示特征融合函数,表示实体属性特征可学习的权重矩阵,表示关联边特征可学习的权重矩阵,表示上下文特征可学习的权重矩阵,表示降维后的第一实体综合特征,表示偏置项。
全文数据:
权利要求:
百度查询: 武汉光谷联合集团有限公司 一种基于产业云的企业画像构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。