合肥工业大学刘建获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥工业大学申请的专利基于多层次特征和注意力机制的图像菜谱检索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116361497B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310301992.0,技术领域涉及:G06F16/53;该发明授权基于多层次特征和注意力机制的图像菜谱检索方法是由刘建;徐辙;俞远哲;莫柠源;周布伟设计研发完成,并于2023-03-24向国家知识产权局提交的专利申请。
本基于多层次特征和注意力机制的图像菜谱检索方法在说明书摘要公布了:本发明公开了一种基于多层次特征和注意力机制的图像菜谱检索方法,属于跨模态检索技术领域,具体步骤如下:步骤S1:收集食物图像数据和食谱数据;步骤S2:构建基于多层次特征和上下文感知的注意力机制的图像菜谱检索模型;步骤S3:通过步骤S1中的食物图像数据和食谱数据对步骤S2中的图像菜谱检索模型进行训练;步骤S4:通过训练好的图像菜谱检索模型对食物图像和食谱进行跨膜态检索。采用上述一种基于多层次特征和注意力机制的图像菜谱检索方法,优化了食物图片和食谱的相互检索,引入了跨模态检索的三元组损失,通过将最大平均差异与三元组损失结合,来更好的拉近对应的图文对,并使不匹配的远离。
本发明授权基于多层次特征和注意力机制的图像菜谱检索方法在权利要求书中公布了:1.一种基于多层次特征和注意力机制的图像菜谱检索方法,其特征在于,具体步骤如下: 步骤S1:收集食物图像数据和食谱数据;所述食谱数据包括配方和食物的烹饪方法数据; 步骤S2:构建基于多层次特征和上下文感知的注意力机制的图像菜谱检索模型; 步骤S2具体如下: 步骤S21:提取食物图像的初始图像特征,同时提取配方和烹饪方法的初始文本特征; 步骤S22:将提取的初始图像特征经过通道注意力机制和空间注意力机制获得区域图片特征,从而得到区域图片特征集合; 步骤S23:对配方和烹饪方法的初始文本特征使用自注意力机制获得重要性高于初始文本特征的单词特征表示,从而得到配方特征集合和烹饪方法特征集合; 步骤S24:将获得的区域图片特征集合和配方特征与烹饪方法特征的组合特征集合作为上下文学习模块的输入,得到区域图片和单词之间的细粒度关系,从而得到上下文注意力损失; 步骤S25:将区域图片特征和步骤S21中获得的初始图像特征重叠在一起并输入第一FC层得到第一图像特征表示V,将配方特征集合和烹饪方法特征集合中的配方和烹饪方法特征拼接在一起并输入第一FC层得到第一食谱表示R; 步骤S26:通过第一图像特征表示V和第一食谱表示R计算三元组损失和最大平均误差; 步骤S27:第一图像特征表示V和第一食谱表示R再分别通过各自的第二FC层得到第二图像特征表示和第二食谱表示,通过第二图像特征表示和第二食谱表示计算得到计算翻译一致性损失; 步骤S28:图像菜谱检索模型的总损失包括上下文注意力损失、三元组损失、最大平均误差以及翻译一致性损失; 步骤S3:通过步骤S1中的食物图像数据和食谱数据对步骤S2中的图像菜谱检索模型进行训练; 步骤S4:通过训练好的图像菜谱检索模型对食物图像和食谱进行跨膜态检索。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230009 安徽省合肥市包河区屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。