买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京博阳世通信息技术有限公司
摘要:本发明公开了一种基于网络采集数据的时空知识图谱智能构建方法及系统,涉及时空知识图谱技术领域。其首先对第一网络平台提取的第一实体的第一文本描述和第二网络平台提取的第一实体的第二文本描述分别进行基于词粒度的语义编码和分析以得到第一文本描述词粒度语义编码特征向量的序列和第二文本描述词粒度语义编码特征向量的序列,接着进行词粒度语义交互融合编码以得到第一文本描述‑第二文本描述细粒度语义交互融合特征,最后基于所述第一文本描述‑第二文本描述细粒度语义交互融合特征,生成所述第一实体的更新文本描述,这样可以使得所构造的知识图谱具有更大的信息全面度,并且可以综合不同平台的文本表达特色。
主权项:1.一种基于网络采集数据的时空知识图谱智能构建方法,其特征在于,包括:从第一网络平台提取第一实体的第一文本描述;从第二网络平台提取所述第一实体的第二文本描述;对所述第一实体的第一文本描述进行基于词粒度的语义编码和分析以得到第一文本描述词粒度语义编码特征向量的序列,其包括:对所述第一实体的第一文本描述进行分词处理后通过包含词嵌入层的语义编码器以得到所述第一文本描述词粒度语义编码特征向量的序列;对所述第一实体的第二文本描述进行基于词粒度的语义编码和分析以得到第二文本描述词粒度语义编码特征向量的序列;对所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列进行词粒度语义交互融合编码以得到第一文本描述-第二文本描述细粒度语义交互融合特征;以及基于所述第一文本描述-第二文本描述细粒度语义交互融合特征,生成所述第一实体的更新文本描述;基于所述第一文本描述-第二文本描述细粒度语义交互融合特征,生成所述第一实体的更新文本描述,包括:对所述第一文本描述-第二文本描述细粒度语义交互融合特征向量进行特征校正处理以得到校正第一文本描述-第二文本描述细粒度语义交互融合特征向量;以及将所述校正第一文本描述-第二文本描述细粒度语义交互融合特征向量通过基于AIGC模型的实体描述生成器以得到所述第一实体的更新文本描述;对所述第一文本描述-第二文本描述细粒度语义交互融合特征向量进行特征校正处理以得到校正第一文本描述-第二文本描述细粒度语义交互融合特征向量,包括:对所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列进行优化融合以得到第一文本描述-第二文本描述语义优化融合特征向量;以及融合所述第一文本描述-第二文本描述语义优化融合特征向量和所述第一文本描述-第二文本描述细粒度语义交互融合特征向量以得到所述校正第一文本描述-第二文本描述细粒度语义交互融合特征向量;对所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列进行优化融合以得到第一文本描述-第二文本描述语义优化融合特征向量,包括:以如下优化公式对所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列进行优化融合以得到所述第一文本描述-第二文本描述语义优化融合特征向量;其中,所述优化公式为: ;其中,是所述第一文本描述词粒度语义编码特征向量的序列级联得到的第一特征向量,是所述第二文本描述词粒度语义编码特征向量的序列级联得到的第二特征向量,和分别是所述第一文本描述词粒度语义编码特征向量的序列级联得到的第一特征向量和所述第二文本描述词粒度语义编码特征向量的序列级联得到的第二特征向量的第个特征值,和分别表示特征向量的一范数的平方和特征向量的二范数的平方根,所述第一特征向量和所述第二特征向量具有相同长度,且是权重超参数,表示向量加法,表示向量减法,表示数值的指数运算,所述数值的指数运算表示计算以所述数值为幂的自然指数函数值,是所述第一文本描述-第二文本描述语义优化融合特征向量的第个特征值;上述优化融合基于特征值粒度下的对应性,将所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列的序列化融合表示进行基于向量尺度的前景流形和背景流形的划分,在特征对应通道超流形体聚合机制下堆叠所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列的动态的特征值通道化关联,标记所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列间的变化的特征语义信息,根据所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列间的语义内容在不同计算维度下的变化性的全连接式堆叠融合,以提升所述第一文本描述词粒度语义编码特征向量的序列和所述第二文本描述词粒度语义编码特征向量的序列的交互融合效果,改进所述第一文本描述-第二文本描述细粒度语义交互融合特征向量通过基于AIGC模型的实体描述生成器得到的所述第一实体的更新文本描述的文本质量。
全文数据:
权利要求:
百度查询: 北京博阳世通信息技术有限公司 基于网络采集数据的时空知识图谱智能构建方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。