西安理工大学肖照林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安理工大学申请的专利基于Transformer的双分支人脸图像关键点检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117037246B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310972064.7,技术领域涉及:G06V40/16;该发明授权基于Transformer的双分支人脸图像关键点检测方法是由肖照林;魏倩影;郝雯;金海燕设计研发完成,并于2023-08-03向国家知识产权局提交的专利申请。
本基于Transformer的双分支人脸图像关键点检测方法在说明书摘要公布了:本发明公开了基于Transformer的双分支人脸图像关键点检测方法,具体按照如下步骤实施:利用双分支网络对人脸图像进行特征提取;双分支网络包括卷积神经网络、Transformer分支网络、特征融合模块、渐进细化模块;设计损失函数,损失函数包括Linit、Lrefine;使用人脸数据库的训练集对双分支网络进行训练,保存训练好的模型;测试所保存的网络模型,计算模型最后输出的L组人脸关键点坐标Ln与真值数据的归一化误差值。本发明的方法解决现有基于自注意力Transformer人脸关键点检测方法无法提取多尺度特征和卷积神经网络的卷积操作只能捕获局部信息且无法建立全局图像的远程依赖的问题。
本发明授权基于Transformer的双分支人脸图像关键点检测方法在权利要求书中公布了:1.基于Transformer的双分支人脸图像关键点检测方法,其特征在于,具体按照如下步骤实施: 步骤S1、利用双分支网络对人脸图像进行特征提取;双分支网络包括卷积神经网络、Transformer分支网络、特征融合模块、渐进细化模块;具体为: 步骤S1-1、将人脸图像经过卷积神经网络进行特征提取,得到W4×H4大小的特征图; 卷积神经网络包括浅层特征提取模块和深层特征提取模块,浅层特征提取模块包括四个编码器;深层特征提取模块包括三个解码器; 将输入W×H人脸图像进行一次可变形卷积操作,得到W2×H2大小的特征图,再经过归一化操作和Relu函数激活后进行最大池化,得到W4×H4大小的特征图;以此类推,经过第二个编码器后,得到W8×H8大小的特征图,经过第三个编码器后得到W16×H16大小的特征图,经过第四个编码器后得到W32×H32大小的特征图; 将得到的W32×H32大小的特征图输入至第一个解码器中,先经过上采样操作得到W16×H16大小的特征图,再经过可变性卷积、归一化操作和Relu函数激活,最终得到W16×H16大小的特征图,以此类推,经过第二个解码器后,得到W8×H8大小的特征图,经过第三个解码器后,得到W4×H4大小的特征图; 步骤S1-2、将人脸图像经过Transformer分支网络进行特征提取,得到W16×H16大小的特征图像; Transformer分支网络包括三个Transformerblock,每个Transformerblock包括:patchmerging,LayerNorm、SW-MSA、MLP; 具体为:将输入W×H大小的图像经过patchmerging和LayerNorm操作,再输入到SW-MSA模块中先按照m×m大小对特征图进行图像分块,然后对每个图像分块分别计算自注意力后得到W4×H4大小的特征图,将未经归一化操作前的输出与SW-MSA模块后的输入进行一个残差连接,经过Layernorm模块进行标准化,然后再将该标准化结果输入MLP模块进行非线性变换,将标准化结果与进行非线性变换的输出进行残差连接,最终输出W4×H4大小的特征图;以此类推,经过第二个Transformerblock输出W8×H8大小的特征图,经过第三个Transformerblock输出W16×H16大小的特征图; 步骤S1-3,将卷积神经网络中的每个编码器输出特征图和经过三次Transformerblock得到三个尺度下的特征图中相同尺度的特征图进行点乘,得到一次融合的特征图; 步骤S1-4,将步骤S1-3中得到的一次融合后的特征图与卷积神经网络中解码器生成的相同尺度特征进行通道拼接,得到尺度不变、通道数增加的二次融合的特征图; 步骤S1-5,将经过三次transformerblock得到三个尺度下的特征图和卷积神经网络中解码器生成的相同尺度特征进行通道拼接,得到尺度不变,通道数翻倍的三次融合的特征图; 步骤S1-6、将得到的三次融合的特征图经过特征融合模块进行特征融合,得到M组关键点的初始地标L1; 步骤S1-7、将步骤S1-6中输出的特征图和得到M组关键点的初始地标L1输入到渐进细化模块,得到对应的N次迭代得到细化关键点L2、L3……LN; 步骤S2,设计损失函数,损失函数包括L init、L refine; 步骤S3、使用人脸数据库的训练集对双分支网络进行训练,保存训练好的模型; 步骤S4、测试步骤S3所保存的网络模型,计算模型最后输出的L组人脸关键点坐标Ln与真值数据的归一化误差值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安理工大学,其通讯地址为:710048 陕西省西安市碑林区金花南路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励