Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京理工大学张鹏获国家专利权

南京理工大学张鹏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京理工大学申请的专利一种基于多粒度特征增强的多模态命名实体识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119398050B

龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411424041.3,技术领域涉及:G06F40/295;该发明授权一种基于多粒度特征增强的多模态命名实体识别方法是由张鹏;郭雨;曾港艳;秦绪功;张可欣设计研发完成,并于2024-10-12向国家知识产权局提交的专利申请。

一种基于多粒度特征增强的多模态命名实体识别方法在说明书摘要公布了:本发明公开了一种基于多粒度特征增强的多模态命名实体识别方法,首先对输入数据进行单模态特征提取,之后基于单模态特征提取的结果进行输入数据的多模态多粒度特征交互,最后基于多粒度特征交互的结果进行输入数据的标签预测,完成实体识别。本发明的方案定义了一种可用于多媒体图文帖子的多模态命名实体识别的框架,其中单模态特征提取率先降低了文本和图像自身无关干扰的结果的影响,具备处理非正式和短文本内容的性能,有效解决数据稀疏嘈杂的问题,多模态的多粒度语义交互充分考虑文本和图片的相关性、图片特征局部和整体的必要性,获得文本所需的更全面的视觉指导,从而提高最终标签预测的准确性,本实验在twitter数据集上有很好的实验结果,具有一定推广实用价值。

本发明授权一种基于多粒度特征增强的多模态命名实体识别方法在权利要求书中公布了:1.一种基于多粒度特征增强的多模态命名实体识别方法,其特征在于,包括以下步骤: 步骤1、对输入数据进行单模态特征提取; 步骤2、基于单模态特征提取的结果进行输入数据的多模态多粒度特征交互: 步骤2-1、通过自注意力机制获取文本隐藏表示t、全局视觉隐藏表示g、局部对象隐藏表述l、CLIP图像特征隐藏表示c; 步骤2-2、基于跨模态transformer进行多级语义交互,获取词感知多模态表示S: 步骤2-2-1、进行全局视觉表示G与文本特征表示T的交互:根据自注意力机制获取的结果,以Q=t,K=V=g作为输入,完成文本和图片的简单语义交互处理,得到词感知图像表示Sg1,即: Q,K,V输入transform作为查询和键值对执行多头注意力MA: qi=QWiq,ki=KWik,vi=VWiv 其中,Wiq,Wik,Wiv∈Rd×dm是第i个头的可训练参数,d,m分别是attentionheads的数量和representation维度,根据输入Q=t,K=V=g得到词感知图像表示Sg1=z;再以Q=g,K=V=t作为输入,再次完成文本和图片的简单语义交互处理,得到图像感知词表示Sg2′,并作为下一层输入,即Q=t,K=V=Sg2′,通过注意力机制得到复杂词感知图像表示Sg2,最后基于系数u,获得全局视觉表示G与文本特征表示T之间的最终语义交互表示:Sg=u×Sg1+1-uSg2, 步骤2-2-2、进行局部对象表示L与文本特征表示T的交互:根据自注意力机制获取的结果,以Q=t,K=V=l作为输入,完成文本和图片的简单语义交互处理,得到词感知图像表示Sl1,再以Q=t,K=V=l作为输入,再次完成文本和图片的简单语义交互处理,得到图像感知词表示Sl2′,并作为下一层输入,即Q=l,K=V=Sl2′,得到复杂词感知图像表示Sl2,最后通过门控函数得到局部对象表示L与文本特征T的最终语义交互表示为Sl=u×Sl1+1-uSl2,其中 步骤2-2-3、进行图片特征CLIP表示C与文本特征表示T的交互:首先将图片特征CLIP表示C进行维度扩充,根据自注意力机制获取的结果,以Q=t,K=V=c作为输入,完成文本和图片的简单语义交互处理,得到词感知图像表示Sc1,再以Q=c,K=V=t作为输入,再次完成文本和图片的简单语义交互处理,得到图像感知词表示Sc2′,并作为下一层输入,即Q=l,K=V=Sc2′,得到复杂词感知图像表示Sc2,最后通过门控函数得到图片特征CLIP表示C与文本特征T的最终语义交互表示为Sc=u×Sc1+1-uSc2,其中 步骤2-2-4、基于步骤2-2-1至步骤2-2-3的结果,利用linear函数链接得到单个词输入的词感知多模态表示: S=linearSg,Sl,Sc 步骤3、基于多粒度特征交互的结果进行输入数据的标签预测,完成实体识别。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市玄武区孝陵卫200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。