成都大学王诗怡获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都大学申请的专利一种基于大数据的非物质文化遗产多模态知识图谱构建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120354927B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510811710.0,技术领域涉及:G06N5/025;该发明授权一种基于大数据的非物质文化遗产多模态知识图谱构建方法及系统是由王诗怡;罗崇蓉;王有军;叶兰;徐莉萍设计研发完成,并于2025-06-18向国家知识产权局提交的专利申请。
本一种基于大数据的非物质文化遗产多模态知识图谱构建方法及系统在说明书摘要公布了:本发明公开了一种基于大数据的非物质文化遗产多模态知识图谱构建方法及系统,属于知识图谱构建领域,所述方法包括:收集不同模态的非物质文化遗产数据,并对采集到的数据进行初步清洗和标注,建立不同模态数据之间的初步关联,得到初版多模态数据集;通过多模态数据清洗与标注模型对所述初版多模态数据集进行处理,得到最终多模态数据集、标注一致性矩阵和跨模态关联矩阵;构建统一的领域知识模型,对非物质文化遗产相关概念、实体及其关系进行结构化建模,形成支持多模态数据的语义表达与知识组织形式;构建结构化的多模态知识图谱。本发明能够有效整合多源异构的非遗数据,提高了非遗知识的获取和利用效率。
本发明授权一种基于大数据的非物质文化遗产多模态知识图谱构建方法及系统在权利要求书中公布了:1.一种基于大数据的非物质文化遗产多模态知识图谱构建方法,其特征在于,所述多模态知识图谱构建方法包括: S100、收集不同模态的非物质文化遗产数据,并对采集到的数据进行初步清洗和标注,建立不同模态数据之间的初步关联,得到初版多模态数据集; S200、通过多模态数据清洗与标注模型对所述初版多模态数据集进行处理,得到最终多模态数据集、标注一致性矩阵和跨模态关联矩阵; S300、构建统一的领域知识模型,对非物质文化遗产相关概念、实体及其关系进行结构化建模,形成支持多模态数据的语义表达与知识组织形式; S400、根据S300输出的知识组织形式中的数据,构建结构化的多模态知识图谱; 多模态数据清洗与标注模型通过多重约束和损失确保不同模态的数据清洗能够高效、准确地完成, 多模态数据清洗与标注模型包括: S210、去噪处理,从数据中去除噪声,通过去噪损失,避免噪声样本干扰,提高整体数据清洗的效果; S220、跨模态对齐,将不同模态的特征对齐,使得相同语义的样本在不同模态之间有相似的表示,优化模态之间的关系; S230、标注一致性,确保在不同模态下的同一类样本保持一致的标签,避免因标注不一致而导致的分类错误; S240、关联矩阵约束,通过稀疏化约束促使模型仅建立在高相似度样本对之间的关联,避免模型过度拟合不相关的样本,并通过调整不同函数的权重系数从而控制各个目标在整体优化中的相对重要性; 所述多模态数据清洗与标注模型的目标函数通过下式表示: , 其中,为最终多模态数据集,包括,清洗后的文本数据矩阵,清洗后的图像数据矩阵,清洗后的音频数据矩阵,为初版多模态数据集,包括,初始文本数据矩阵,初始图像数据矩阵,初始音频数据矩阵,为控制去噪强度的权重系数,为数据去噪函数,为控制模态对齐优化程度的权重系数,为跨模态关联优化函数,为控制标注一致性的权重系数,为标注一致性约束函数,为控制关联矩阵稀疏性的权重系数,为关联矩阵约束函数,为标注一致性矩阵,为跨模态关联矩阵; 所述数据去噪函数,用于确保模型能够正确地从数据中提取有效的特征,数据去噪函数通过惩罚模型中的不一致性或错误的特征,减少噪声影响,从而改善特征表示的质量; 所述跨模态关联优化函数,用于优化跨模态特征的对齐,通过将不同模态的特征在一个共享的嵌入空间中尽可能接近,来提高模型在跨模态任务中的表现; 所述标注一致性约束函数,用于保证模型在学习过程中保持样本的标注一致性,确保不同模态中的同一类样本具有一致的标注信息; 所述关联矩阵约束函数,通过稀疏化关联矩阵,使得只有在具有足够相似度的跨模态特征之间才会有非零关联,所述关联矩阵约束函数通过L1范数约束,促使关联矩阵中的元素大部分接近零,从而减少不相关或低相似度样本之间的联系,保持模型的高效性; 构建统一的领域知识模型包括如下子步骤: S310、基于标注一致性矩阵进行核心本体类定义,对标注一致性矩阵中的类别进行统计,计算每个类别的总置信度, 若某个类别的总体置信度显著高于其他类别,则将该类别定义为核心本体类; S320、基于跨模态关联矩阵的跨模态关联与知识规则实现关系定义,通过跨模态关联矩阵中跨模态数据对的信息,推断不同实体之间的关系,实现不同模态之间的对齐; S330、根据数据矩阵集中的数据,抽取文本知识。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都大学,其通讯地址为:610000 四川省成都市龙泉驿区成洛大道2025号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励