买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:鲁东大学
摘要:本发明涉及利用横向跨尺度融合查询矩阵检测鲍鱼幼苗的方法及装置,属于计算机视觉技术领域。具体方法为,包括建立鲍鱼幼苗数据集,将鲍鱼幼苗数据集分为测试集和训练集,将训练集输入横向跨尺度查询矩阵融合鲍鱼幼苗检测算法中,所述横向跨尺度查询矩阵融合鲍鱼幼苗检测算法具体为:建立模型、训练模型;所述建立模型,包括一个对输入图片进行初步特征提取的骨干网络,骨干网络从多尺度提取图片特征信息,并将信息输送到特征金字塔FPN模块,骨干网络提取的不同尺度的图片信息输送到相应层级的FPN模块中,每个层级的FPN模块对应的设置一个DGAM模块,DGAM模块进一步处理图片信息后,将处理后的信息输入到HEAD模块中进行信息处理,输出检测结果。
主权项:1.一种利用横向跨尺度融合查询矩阵检测鲍鱼幼苗的方法,包括建立鲍鱼幼苗数据集,将鲍鱼幼苗数据集分为测试集和训练集,其特征在于,将训练集输入横向跨尺度查询矩阵融合鲍鱼幼苗检测算法中,所述横向跨尺度查询矩阵融合鲍鱼幼苗检测算法具体为:建立模型、训练模型;所述建立模型,包括一个对输入图片进行初步特征提取的骨干网络,骨干网络从多尺度提取图片特征信息,并将信息输送到特征金字塔FPN模块,骨干网络提取的不同尺度的图片信息输送到相应层级的FPN模块中,每个层级的FPN模块对应的设置一个DGAM模块,DGAM模块进一步处理图片信息后,将处理后的信息输入到HEAD模块中进行信息处理,输出检测结果;所述骨干网络,输出多尺度特征图,当输入图像的大小为H×W时,FPN特征的大小为;表示金字塔级别,等于,检测头由四个3×3卷积层组成,获得的特征金字塔涵盖不同程度大小的分辨率和语义信息;所述DGAM模块通过两个3x3的空洞卷积提取图片信息;所述DGAM模块为:给定一个特征,则中间特征和输出特征的定义式为: ,而查询的输入为,对应的stride为,输出热度图,o代表一个中心坐标位于(,)的检测框,如果o的大小小于指定阈值,那么其中心坐标在在输出图的对应位置上的GT设置为1,否则设0;计算每个特征位置之间的最小距离公式为: ;而groundtruth的查询分数定义为: ,在获取后,对应的将会分配到下一层上来指导检测位置,而查询到的键值,则是;在得到对应位置的查询值后,将上下层对应位置的查询值相互融合,最终得到修正的对应的查询值: ;接下来,在中依据键值的位置计算head和用于下一层的查询值,这个过程通过稀疏矩阵实现,极大的节省了计算量;查询head被当作二分类问题进行处理,使用focalloss作为损失函数,模型总的损失计算表示为: ;其中表示focalloss损失,表示类别结果,而表示相应的真实框的类别结果,表示smooth损失,表示检测框回归结果,而表示相应的真实框的边界框,表示查询分数结果,而表示相应的真实框的查询结果每一个在大尺度提取信息的FPN模块还同时向向下的在小尺度提取信息的FPN模块输送图片信息。
全文数据:
权利要求:
百度查询: 鲁东大学 利用横向跨尺度融合查询矩阵检测鲍鱼幼苗的方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。