基于单词-图片配对和交叉Transformer的多模态命名实体识别方法

导航：龙图腾网> 最新专利技术> 基于单词-图片配对和交叉Transformer的多模态命名实体识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：合肥工业大学

摘要：本发明公开了一种基于单词‑图片配对和交叉Transformer的多模态命名实体识别方法，包括：1、获取多模态的先置数据集；2、获取另一个包含文本模态的英文数据集以及视觉模态的图像数据集的多模态的目标数据集，并构建视觉‑窗格拓展前缀匹配树ExtendTrie；3、获取文本‑图片对的编码特征表示；4、构建基于Transformer的图像‑文本交叉融合模型CLT，得到最终的交叉融合特征F'；5、训练图像‑文本交叉融合模型CLT。本发明在处理多模态命名实体识别任务时，能够综合利用视觉‑窗格信息，提高文本‑图片对匹配度，并利用文本与视觉信息，以得到有效的数据特征表示，从而能提高命名实体识别任务的精度。

主权项：1.一种基于单词-图片配对和交叉Transformer的多模态命名实体识别方法，其特征在于，是按如下步骤进行：步骤1、获取多模态的先置数据集，且所述先置数据集中包含有文本模态的英文数据集以及视觉模态的图像数据集；其中，所述英文数据集中的单词与图像数据集中图片存在对应关系；步骤2、获取另一个包含文本模态的英文数据集以及视觉模态的图像数据集的多模态的目标数据集，并作为先置数据集的补充数据集，用于构建视觉-窗格拓展前缀匹配树ExtendTrie；令目标数据集的NER标签序列为A；步骤3、对目标数据集中的任意一个文本-图片对进行处理，获取文本-图片对的编码特征表示Sh,v；步骤4、构建基于Transformer的图像-文本交叉融合模型CLT，并对文本-图片对的编码特征表示集合Sh,v进行处理，得到最终的交叉融合特征F'；步骤5、训练图像-文本交叉融合模型CLT：步骤5.1、利用式18构建损失函数式18中，PrA'|F'表示在给定交叉融合特征F'下，输出标签序列为A'的条件概率；步骤5.2、利用Adam优化器对所述图像-文本交叉融合模型CLT进行训练，并计算以更新网络参数，直至迭代次数达到最大迭代次数时或达到最小时，停止训练，从而得到训练后的最优命名实体识别网络模型，用于结合输入的图片对输入的英文句子进行命名实体识别。

全文数据：

权利要求：

百度查询：合肥工业大学基于单词-图片配对和交叉Transformer的多模态命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种吹扫式气热共储装置及换热系统

下一篇：一种流量控制阀

相关技术

一种吹扫式气热共储装置及换热系统

一种流量控制阀

一种基于B2b信号的低轨卫星实时定轨与时频同步方法

针刺式固晶机

一种叶轮自吸冷却的磁悬浮风机

一种地铁或列车车底关键部件自适应巡检方法及装置

全自动叠合车缝机

光学瞄准镜防震动冲击转换装置

一种基于GLSL ES的图像渲染方法及装置

顾及云信息表征指数与几何形态特征的遥感云检测方法

一种翻译方法、翻译装置和计算机可读存储介质

一种多通道绿化带快速种植设备及其工作方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于单词-图片配对和交叉Transformer的多模态命名实体识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务