苏州大学刘恋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州大学申请的专利一种基于多模型局部描述整合的行人描述生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119251855B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411776734.9,技术领域涉及:G06V30/41;该发明授权一种基于多模型局部描述整合的行人描述生成方法是由刘恋;邵前程;陆宇昕;吴彧;曹敏设计研发完成,并于2024-12-05向国家知识产权局提交的专利申请。
本一种基于多模型局部描述整合的行人描述生成方法在说明书摘要公布了:本发明公开了一种基于多模型局部描述整合的行人描述生成方法,涉及图像数据处理技术领域。包括获取待标注的行人图像,将图像与预设指令输入至多个图生文模型,生成行人各属性的局部文本描述;利用图文匹配模型提取图像和文本特征,通过余弦相似度计算图像与文本的匹配度,从多个描述中筛选出与图像最匹配的属性描述;采用大语言模型将筛选出的局部描述合并,生成行人整体的流畅文本描述;通过行人图像和文本数据集对图文匹配模型进行训练,并利用对比损失和匹配损失函数进行优化,直至总体损失函数收敛。本发明通过跨模态大模型对行人的属性短语的生成,使得对于行人属性短语的描述更加丰富多样,避免生成的描述趋同。
本发明授权一种基于多模型局部描述整合的行人描述生成方法在权利要求书中公布了:1.一种基于多模型局部描述整合的行人描述生成方法,其特征在于:包括, 获取待标注的行人图像,将图像与预设指令输入至多个图生文模型,生成行人各属性的局部文本描述; 利用图文匹配模型提取图像特征和各局部文本描述的文本特征,通过余弦相似度计算所述图像特征与所述文本特征的匹配度,从多个局部文本描述中筛选出与图像最匹配的局部文本描述; 采用大语言模型将筛选出的局部文本描述合并,生成行人整体的流畅文本描述; 其中,行人整体的流畅文本描述包括: 其中,LLM为大语言模型,T为最终合并的文本描述,A1,A2,...,AK表示行人图像中具有的属性,MLLMi为第i个跨模态大模型,为针对第j个属性设计的指令提示,I为图像,K为行人图像中具有的属性的数量;为经过筛选后的针对属性A1的局部文本描述;为经过筛选后的针对属性A2的局部文本描述;为经过筛选后的针对属性AK的局部文本描述;为经过筛选后的针对属性Aj的局部文本描述;Aj表示行人图像中具有的第j个属性;π1表示经过相似度计算后,相似度降序排序顺序排名为π1,表示相似度最高;表示针对属性Aj经过相似度计算后,降序排序后所得的相似度最高的局部文本描述;表示针对属性Aj在第i个跨模态模型中生成的属性文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州大学,其通讯地址为:215000 江苏省苏州市吴江区久泳西路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。