Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于迁移学习的跨领域多模态工业数据抽取与融合方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广东恒电信息科技股份有限公司

摘要:本发明公开了基于迁移学习的跨领域多模态工业数据抽取与融合方法,属于数据处理技术领域,包括:获取数据集的特征集,抽取关键信息,基于关键信息生成标准数据;基于训练集构建数据迁移模型,数据迁移模型基于目标标签将源数据库对应的标准数据迁移至目标数据库,生成迁移数据;生成数据迁移模型的第一准确率,基于第一准确率校正剩余数据集中标准数据对应的关键信息,生成数据标签;构建多模态融合模型,将目标数据库中对应的标准数据与迁移数据融合生成融合数据,重复执行此步骤,至所有数据集对应的标准数据均融合至目标数据库中,生成多领域的融合数据集。通过本发明可以提高数据迁移的准确性和数据融合的完整性。

主权项:1.基于迁移学习的跨领域多模态工业数据抽取与融合方法,其特征在于,所述方法包括如下步骤:S1:收集多领域的工业数据,生成多个数据集,构建数据抽取模型,所述数据抽取模型获取所述数据集中的特征集,基于所述特征集在所述数据集中抽取关键信息,基于所述关键信息生成标准数据;S2:将任一数据集对应的所述标准数据设定为训练集,基于所述训练集构建数据迁移模型,将目标数据库中对应的数据集的所述关键信息设定为目标标签,所述数据迁移模型基于所述目标标签将源数据库对应的所述标准数据迁移至所述目标数据库,生成迁移数据,其中,基于预训练的Transformer模型作为迁移学习的起点,将所述训练集输入所述Transformer模型中,训练生成适配的神经网络模型,将所述神经网络模型设定为所述数据迁移模型;S3:比较所述源数据库与所述目标数据库中同一所述标准数据之间的数据相似度,生成所述数据迁移模型的第一准确率,基于所述第一准确率校正剩余数据集中所述标准数据对应的所述关键信息,生成数据标签;S4:构建多模态融合模型,基于所述多模态融合模型将所述目标数据库中对应的所述标准数据与所述迁移数据进行融合生成融合数据,重复执行此步骤,至所有数据集对应的所述标准数据均融合至所述目标数据库中,生成多领域的融合数据集;其中,所述构建多模态融合模型包括以下步骤:设置一个多任务学习框架的技术模型,基于数据生成类型同时处理多种模态的数据,并优化资源分配,通过所述技术模型的解构分散策略和神经架构搜索技术,自动设定最优的技术模型配置,引入注意力机制和图卷积网络,并设置元学习技术,获取所述技术模型的收敛指数,基于所述收敛指数模拟和合成数据生成技术,以训练所述技术模型,将训练后的所述技术模型设定为所述多模态融合模型;生成所述融合数据包括以下步骤:将所述目标数据库中包含的所述标准数据和所述迁移数据均设定为待融合数据,基于所述多模态融合模型提取所述待融合数据的所述数据生成类型和时间信息,将所述待融合数据基于所述时间信息分类为第一类数据和第二类数据,若所述融合数据存在所述时间信息,则分类为所述第一类数据,否则,分类为所述第二类数据;在所述第一类数据中基于变分近似方法分别生成与相同数据生成类型包含的所述时间信息对应的潜在变量分布,标记所述多模态融合模型的隐藏状态,基于所述潜在变量分布更新所述隐藏状态,将更新后的所述隐藏状态和所述潜在变量分布输入所述多模态融合模型中,基于所述神经架构搜索技术输出所述潜在变量分布对应的结果数据,将所有所述结果数据设定为所述第一类数据对应的第一融合数据;将所述第二类数据基于所述数据生成类型和所述关键信息依次汇总生成第二融合数据,将所述第一融合数据与所述第二融合数据组合设定为所述融合数据。

全文数据:

权利要求:

百度查询: 广东恒电信息科技股份有限公司 基于迁移学习的跨领域多模态工业数据抽取与融合方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。