中国电子科技集团公司第十研究所刘杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电子科技集团公司第十研究所申请的专利一种多模态非结构化内容关联检索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120407839B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510912421.X,技术领域涉及:G06F16/583;该发明授权一种多模态非结构化内容关联检索方法是由刘杰;刘学;向涛设计研发完成,并于2025-07-03向国家知识产权局提交的专利申请。
本一种多模态非结构化内容关联检索方法在说明书摘要公布了:本发明公开了一种多模态非结构化内容关联检索方法,包括对多模态数据进行特征提取,得到不同模态下数据的特征;将多模态特征进行对齐,得到多模态对齐特征;对多模态对齐特征进行随机掩码,送入跨模态自注意力模型融合,得到掩码后的多模态融合特征向量;提取每一个图像的增强特征;通过交叉注意力网络对增强特征进行处理,得到不同图像之间的余弦相似度;进行图像特征的匹配,得到图像的关联结果;通过输入检索文本到语言大模型中得到文本特征,通过多模态数据嵌入空间,使用余弦相似度匹配出最相似的图像,得到图像的检索结果。本发明提高了多模态特征融合的准确性和稳定性,提高了图像检索的准确性和效率。
本发明授权一种多模态非结构化内容关联检索方法在权利要求书中公布了:1.一种多模态非结构化内容关联检索方法,其特征在于,包括: S1:对多模态数据进行特征提取,得到不同模态下数据的特征; S2:根据得到的多模态特征,通过模态中心感知将多模态特征进行跨模态全局特征对齐,得到多模态对齐特征; 具体过程如下: S201:将同一对多模态特征作为正样本对,不同对象的跨域多模态特征间构成负样本对,构建正负样本对; S202:将同一对象的多模态特征中心作为锚点,并作为对比学习过程正样本,采用对比学习损失函数,进行对比学习更新模型参数; 损失函数表示如下: 其中,为当前输入模态特征与多模态特征中心间的相似度量得分,为当前输入对象特征与其他对象特征间的相似度量得分,为温度系数,用于调节模型学习时对正负样本对的关注程度,为所有对象样本的集合,为所有模态的集合; S203:通过训练好的模型将不同模态特征映射到公共特征空间中; S204:通过多模态特征逆映射恢复特征原有维度,得到对齐的多模态特征; S3:对所述多模态对齐特征进行随机掩码,并将掩码后的特征向量送入跨模态自注意力Transformer模型融合,得到掩码后的多模态融合特征向量; S4:对掩码后的多模态融合特征进行处理,提取到每一个图像的增强特征; S5:通过交叉注意力网络对增强特征进行处理,得到不同图像之间的余弦相似度; S6:根据得到的所述余弦相似度,通过进行度量计算进行图像特征的匹配,得到图像的关联结果; S7:根据得到的图像关联结果,通过输入检索文本到语言大模型中得到文本特征,通过多模态数据嵌入空间,使用余弦相似度匹配出最相似的图像,得到图像的检索结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司第十研究所,其通讯地址为:610000 四川省成都市金牛区茶店子东街48号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。