Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京化工大学王坤峰获国家专利权

恭喜北京化工大学王坤峰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京化工大学申请的专利基于Transformer全局与局部注意力交互的目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114743017B

龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210399175.9,技术领域涉及:G06V10/40;该发明授权基于Transformer全局与局部注意力交互的目标检测方法是由王坤峰;陈阳;张书琴;陈思涵设计研发完成,并于2022-04-15向国家知识产权局提交的专利申请。

基于Transformer全局与局部注意力交互的目标检测方法在说明书摘要公布了:本发明属于计算机视觉领域,具体涉及了一种基于Transformer全局与局部注意力交互的目标检测方法,旨在解决Transformer模型计算成本高、复杂度高、全局和局部交互不充分,导致目标检测结果准确性和精度低的问题。本发明包括:对待处理二维图像预处理;以图像令牌为单位进行窗口划分;基于窗口做局部多头注意力计算;局部窗口下采样,拼接为一个新的全局窗口并做全局多头注意力计算;进行全局和局部的交互,使全局信息的补充到局部信息;进行图像令牌合并获得多尺度特征后送入目标检测模块,获取待处理二维图像的感兴趣区域的类别及位置坐标。本发明具有较强的特征表达能力,可以克服复杂环境下目标存在的巨大差异性,具有较高的处理速度,并能获取更精准的检测结果。

本发明授权基于Transformer全局与局部注意力交互的目标检测方法在权利要求书中公布了:1.一种基于Transformer全局与局部注意力交互的目标检测方法,其特征在于,该目标检测方法包括:将待处理图像划分为4*4的图像令牌,线性投影成高纬度向量,并对投影的第一初始特征图进行第一设定次数的全局局部注意力特征变换,获得第一特征图;对所述第一特征图进行图像令牌合并,并对合并的初始第二特征图进行第二设定次数的全局局部注意力特征变换,获得第二特征图;对所述第二特征图进行图像令牌合并,并对合并的初始第三特征图进行第三设定次数的全局局部注意力特征变换,获得第三特征图;对所述第三特征图进行图像令牌合并,并对合并的初始第四特征图进行第四设定次数的全局局部注意力特征变换,获得第四特征图;将所述第二特征图、所述第三特征图和所述第四特征图的特征信息分别输入检测头,获得目标检测结果;所述全局局部注意力特征变换,其方法为:对所述第一初始特征图第二初始特征图第三初始特征图第四初始特征图进行层归一化处理;将层归一化后的特征图以设定大小分割为不重叠的多个局部窗口,并分别进行每一个局部窗口的多头自注意力计算,获得局部特征图;将所述局部特征图分别与对应的初始特征图进行残差连接,并分别进行下采样操作,将下采样的图像令牌拼接为全局窗口,进行全局窗口的多头自注意力计算,获得全局特征图;进行所述局部窗口和所述全局窗口的跨尺度全局局部注意力计算,获得融入全局信息的局部特征图;进行所述融入全局信息的局部特征图的窗口合并、层归一化以及多层感知机操作,获得第一特征图第二特征图第三特征图第四特征图;所述多头自注意力计算,其表示为: 其中,Q,K,V代表将特征图通过线性层使特征维度扩大3倍后拆分获取的查询矩阵、键值矩阵和值矩阵,矩阵的每个张量代表窗口的像素特征,B为表征像素间的相对位置的相对位置偏移矩阵,T代表矩阵转置,代表关系矩阵,代表注意力关系矩阵,Softmax为将一组注意力系数转换为范围在[0,1]并且和为1的概率分布的函数,d代表通道数;局部多头自注意力计算将查询矩阵Q、键值矩阵K和值矩阵V的通道数拆分为若干组,每组属于1个头,每个头独立的进行自注意力计算,并将各个头的结果进行横向拼接,其表示为:MultiHeadQ,K,V=Concathead1,…,headi,…,headh其中,h为局部多头自注意力计算中头的数目,获取第一特征图的阶段,h=3,随后获取第二特征图、第三特征图和第四特征图的阶段,h以2倍递增,headi,i∈[1,h]为第i组查询矩阵Q、键值矩阵K和值矩阵V的进行自注意力计算的结果,Concat为横向拼接;所述跨尺度全局局部注意力计算,其表示为: 其中,QL为局部窗口查询矩阵,矩阵的每个张量代表局部窗口的像素特征,KG,VG为全局窗口键值矩阵和值矩阵,矩阵的每个张量代表全局窗口的像素特征;全局局部多头自注意力计算将查询矩阵QL、键值矩阵KG和值矩阵VG的通道数拆分为若干组,每组属于1个头,每个头独立的进行自注意力计算,并将各个头的结果进行横向拼接,其表示为:GL-MultiHeadQL,KG,VG=ConcatheadGL-1,…,headGL-i,…,headGL-h其中,GL-h为全局局部多头自注意力计算中头的数目,获取第一特征图的阶段,GL-h=3,随后获取第二特征图、第三特征图和第四特征图的阶段,GL-h以2倍递增,headGL-i,GL-i∈[GL-1,GL-h]为第i组查询矩阵QL、键值矩阵KG和值矩阵VG的进行自注意力计算的结果,Concat为横向拼接。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京化工大学,其通讯地址为:100029 北京市朝阳区北三环东路15号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。