Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

车辆密集场景中的图像-文本跨模态车辆检索模型训练方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:电子科技大学

摘要:本发明涉及计算机技术领域,提供了一种车辆密集场景中的图像‑文本跨模态车辆检索模型训练方法。该方法解决现有技术中车辆检索模型无法准确理解图像主要内容的问题,提高检索准确率。方案包括获取训练样本集,对图像样本和文本样本进行特征提取,得到视觉‑文本联合嵌入;计算图像样本的语义特征;基于余弦相似度计算图像样本和文本样本间的特征相似度,得到全局和局部特征相似度,通过可学习网络整合全局和局部特征相似度,得到最终的模态间相似度;计算交通场景的图像样本间的语义相似度;根据损失函数更新的权重,所述损失函数包含三元组损失和图像语义损失。本发明用于车辆密集场景中的图像‑文本跨模态车辆检索。

主权项:1.一种车辆密集场景中的图像-文本跨模态车辆检索模型训练方法,其特征在于,包括:S1:获取训练样本集,所述训练样本集包含多个交通流监控视频中车辆密集的帧图像数据和其对应的描述文本,即图像样本和文本样本,分别对图像样本和文本样本的进行特征提取,并得到视觉-文本联合嵌入;S2:对图像样本对应的描述文本进行TFIDF向量计算,得到图像样本的语义特征;S3:基于余弦相似度计算图像样本和文本样本间的特征相似度,得到全局和局部特征相似度,通过可学习网络整合全局和局部特征相似度,得到最终的模态间相似度;S4:计算交通场景的图像样本间的语义相似度;S5:根据损失函数更新的权重,所述损失函数包含三元组损失和图像语义损失。

全文数据:

权利要求:

百度查询: 电子科技大学 车辆密集场景中的图像-文本跨模态车辆检索模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术