买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江理工大学
摘要:本发明公开了一种基于语言表达的任意类别计数模型及其计数方法,计数模型包括指代表达理解模块和视觉计数回归模块,指代表达理解模块用来将输入的自然语言或文本描述进行特征标记嵌入、特征提取、特征融合等处理,预测出原始图像中的目标模板信息;视觉计数回归模块用来根据目标模板信息和原始图像进行特征提取和相似性学习,最终输出目标实例在原始图像场景中的预测数量。本发明通过指代表达理解模块来引导零样本计数,能够解析、理解人类自然语言并预测准确的目标模板,通过视觉计数回归模块对目标模板信息和原始图像进行特征提取和相似性学习,实现更一般化与智能化的计数功能,具有节省计算资源、快速识别位置、应用泛化性高的特点。
主权项:1.基于语言表达的任意类别计数模型,其特征在于:包括指代表达理解模块和视觉计数回归模块,所述指代表达理解模块用来将输入的自然语言或文本描述进行特征标记嵌入、特征提取、特征融合等处理,预测出原始图像中的目标模板信息;所述视觉计数回归模块用来根据目标模板信息和原始图像进行特征提取和相似性学习,最终输出目标实例在原始图像场景中的预测数量。
全文数据:
权利要求:
百度查询: 浙江理工大学 基于语言表达的任意类别计数模型及其计数方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。